Desarrollador de IBM

Generar audio similar al humano a partir de texto

AIMarca de tiempo: 9 de julio de 2020 12:00 a. M.

Nodo de origen: 749302

Reeditado por Platón

seguidores: 0

Resumen

Usando los componentes Node.js y React, cree una aplicación web que genere audio similar al humano a partir del texto. La aplicación utiliza IBM® Watson ™ Text to Speech para proporcionar una selección de voces con soporte para múltiples idiomas y géneros. Watson Text to Speech está disponible en IBM Cloud y con el Kit de Watson API en IBM Cloud Pak ™ para datos.

Descripción

Construida con componentes React y un servidor Node.js, la aplicación web de texto a voz toma entrada de texto y la envía al servicio de Texto a voz de Watson para que se pronuncie en la voz que elija. Varias voces (masculinas y femeninas) están disponibles, cubriendo muchos idiomas y regiones.

Al agregar elementos SSML al texto de entrada, puede manipular la voz. SSML se puede usar para controlar el tiempo, la expresividad, el tono, la respiración, la frecuencia, la pronunciación y más.

Esta aplicación está diseñada para que comiences. Una aplicación de texto a voz es un ejemplo divertido, pero los resultados reales ocurren cuando usa este código para darle voz a su propia aplicación.

Watson Text to Speech está disponible en IBM Cloud y con el Kit Watson API en IBM Cloud Pak para datos. Con IBM Cloud Pak for Data, puede aprovisionar Watson Text to Speech en su propia nube privada o donde sea que se ejecute Red Hat OpenShift.

Cuando haya completado este patrón de código, comprenderá cómo:

Recupere y reproduzca audio del servicio de texto a voz de Watson utilizando una API REST
Integre el servicio de texto a voz de Watson en una aplicación web
Use componentes React y un servidor Node.js

Flujo

Generate human-like audio from text

El usuario proporciona algo de texto como entrada a la aplicación (que se ejecuta localmente, en IBM Cloud o en IBM Cloud Pak for Data).
La aplicación envía el texto al servicio Texto a voz.
A medida que se procesan los datos, el servicio Texto a voz devuelve información de audio al elemento de audio HTML5 para su reproducción.

Instrucciones

Encuentre los pasos detallados para este patrón en el readme archivo. Los pasos le muestran cómo:

Aprovisione el servicio de texto a voz de Watson.
Implementar el servidor.
Utiliza la aplicación web.

Fuente: https://developer.ibm.com/patterns/generate-human-like-audio-from-text/

Sello de tiempo: 9 de Julio de 2020

Mas de Desarrollador de IBM

Cree un asistente para evaluar varias pólizas de seguro médico

Clúster de origen:

Desarrollador de IBM

Nodo de origen: 747698

Sello de tiempo: Nov 2, 2020

Mejore los resultados de Watson Discovery utilizando la capacitación de relevancia basada en API

Clúster de origen:

Desarrollador de IBM

Nodo de origen: 1537609

Sello de tiempo: Nov 15, 2021

Seguimiento de objetos en video con OpenCV y Deep Learning

Clúster de origen:

Desarrollador de IBM

Nodo de origen: 749912

Sello de tiempo: 16 de junio de 2020

Validar modelos de aprendizaje profundo de visión por computadora

Clúster de origen:

Desarrollador de IBM

Nodo de origen: 749609

Sello de tiempo: 16 de junio de 2020

Predecir transacciones fraudulentas con Findability Platform Predict Plus

Clúster de origen:

Desarrollador de IBM

Nodo de origen: 748175

Sello de tiempo: 21 de octubre de 2020

Analice patrones de datos para encontrar reclamos de seguro fraudulentos

Clúster de origen:

Desarrollador de IBM

Nodo de origen: 748954

Sello de tiempo: 30 de jul, 2020

Obtenga información valiosa con IA sobre transmisiones de cámara y videos en vivo

Clúster de origen:

Desarrollador de IBM

Nodo de origen: 748599

Sello de tiempo: 31 de Agosto, 2020

Cree una aplicación web para optimizar el inventario de su cadena de suministro

Clúster de origen:

Desarrollador de IBM

Nodo de origen: 747574

Sello de tiempo: Nov 30, 2020

Cree una aplicación web con tecnología de aprendizaje automático para responder preguntas

Clúster de origen:

Desarrollador de IBM

Nodo de origen: 1573047

Sello de tiempo: Nov 4, 2019

Cree un marco que conecte WhatsApp a los servicios de Watson

Clúster de origen:

Desarrollador de IBM

Nodo de origen: 748173

Sello de tiempo: 22 de octubre de 2020

Cree un asistente de seguro virtual para ayudar a procesar los reclamos

Clúster de origen:

Desarrollador de IBM

Nodo de origen: 749304

Sello de tiempo: 29 de junio de 2020

nuevo-en-la-calle-julio-11-2021-innd-simplicity-esports-globex-data-fandom-sports-winston-gold-strikeforce-sukai.jpg

Cree un robot de voz conversacional utilizando los servicios de WhatsApp y Watson

Clúster de origen:

Desarrollador de IBM

Nodo de origen: 1856777

Sello de tiempo: 22 de junio de 2021