Generar audio similar al humano a partir de texto

Nodo de origen: 749302

Resumen

Usando los componentes Node.js y React, cree una aplicación web que genere audio similar al humano a partir del texto. La aplicación utiliza IBM® Watson ™ Text to Speech para proporcionar una selección de voces con soporte para múltiples idiomas y géneros. Watson Text to Speech está disponible en IBM Cloud y con el Kit de Watson API en IBM Cloud Pak ™ para datos.

Descripción

Construida con componentes React y un servidor Node.js, la aplicación web de texto a voz toma entrada de texto y la envía al servicio de Texto a voz de Watson para que se pronuncie en la voz que elija. Varias voces (masculinas y femeninas) están disponibles, cubriendo muchos idiomas y regiones.

Al agregar elementos SSML al texto de entrada, puede manipular la voz. SSML se puede usar para controlar el tiempo, la expresividad, el tono, la respiración, la frecuencia, la pronunciación y más.

Esta aplicación está diseñada para que comiences. Una aplicación de texto a voz es un ejemplo divertido, pero los resultados reales ocurren cuando usa este código para darle voz a su propia aplicación.

Watson Text to Speech está disponible en IBM Cloud y con el Kit Watson API en IBM Cloud Pak para datos. Con IBM Cloud Pak for Data, puede aprovisionar Watson Text to Speech en su propia nube privada o donde sea que se ejecute Red Hat OpenShift.

Cuando haya completado este patrón de código, comprenderá cómo:

  • Recupere y reproduzca audio del servicio de texto a voz de Watson utilizando una API REST
  • Integre el servicio de texto a voz de Watson en una aplicación web
  • Use componentes React y un servidor Node.js

Flujo

Generate human-like audio from text

  1. El usuario proporciona algo de texto como entrada a la aplicación (que se ejecuta localmente, en IBM Cloud o en IBM Cloud Pak for Data).
  2. La aplicación envía el texto al servicio Texto a voz.
  3. A medida que se procesan los datos, el servicio Texto a voz devuelve información de audio al elemento de audio HTML5 para su reproducción.

Instrucciones

Encuentre los pasos detallados para este patrón en el readme archivo. Los pasos le muestran cómo:

  1. Aprovisione el servicio de texto a voz de Watson.
  2. Implementar el servidor.
  3. Utiliza la aplicación web.

Fuente: https://developer.ibm.com/patterns/generate-human-like-audio-from-text/

Sello de tiempo:

Mas de Desarrollador de IBM