Resumen
Usando los componentes Node.js y React, cree una aplicación web que genere audio similar al humano a partir del texto. La aplicación utiliza IBM® Watson ™ Text to Speech para proporcionar una selección de voces con soporte para múltiples idiomas y géneros. Watson Text to Speech está disponible en IBM Cloud y con el Kit de Watson API en IBM Cloud Pak ™ para datos.
Descripción
Construida con componentes React y un servidor Node.js, la aplicación web de texto a voz toma entrada de texto y la envía al servicio de Texto a voz de Watson para que se pronuncie en la voz que elija. Varias voces (masculinas y femeninas) están disponibles, cubriendo muchos idiomas y regiones.
Al agregar elementos SSML al texto de entrada, puede manipular la voz. SSML se puede usar para controlar el tiempo, la expresividad, el tono, la respiración, la frecuencia, la pronunciación y más.
Esta aplicación está diseñada para que comiences. Una aplicación de texto a voz es un ejemplo divertido, pero los resultados reales ocurren cuando usa este código para darle voz a su propia aplicación.
Watson Text to Speech está disponible en IBM Cloud y con el Kit Watson API en IBM Cloud Pak para datos. Con IBM Cloud Pak for Data, puede aprovisionar Watson Text to Speech en su propia nube privada o donde sea que se ejecute Red Hat OpenShift.
Cuando haya completado este patrón de código, comprenderá cómo:
- Recupere y reproduzca audio del servicio de texto a voz de Watson utilizando una API REST
- Integre el servicio de texto a voz de Watson en una aplicación web
- Use componentes React y un servidor Node.js
Flujo
- El usuario proporciona algo de texto como entrada a la aplicación (que se ejecuta localmente, en IBM Cloud o en IBM Cloud Pak for Data).
- La aplicación envía el texto al servicio Texto a voz.
- A medida que se procesan los datos, el servicio Texto a voz devuelve información de audio al elemento de audio HTML5 para su reproducción.
Instrucciones
Encuentre los pasos detallados para este patrón en el readme archivo. Los pasos le muestran cómo:
- Aprovisione el servicio de texto a voz de Watson.
- Implementar el servidor.
- Utiliza la aplicación web.
Fuente: https://developer.ibm.com/patterns/generate-human-like-audio-from-text/