Generieren Sie menschliches Audio aus Text

Quellknoten: 749302

Zusammenfassung

Erstellen Sie mithilfe der Komponenten Node.js und React eine Web-App, die aus Text menschenähnliches Audio generiert. Die App verwendet IBM® Watson ™ Text to Speech, um eine Auswahl von Stimmen mit Unterstützung für mehrere Sprachen und Geschlechter bereitzustellen. Watson Text to Speech ist in der IBM Cloud und mit dem Watson API Kit in IBM Cloud Pak ™ for Data verfügbar.

Beschreibung

Die Text-to-Speech-Webanwendung wurde mit React-Komponenten und einem Node.js-Server erstellt und nimmt Texteingaben entgegen und sendet sie an den Watson Text-to-Speech-Dienst, damit sie mit der von Ihnen gewählten Stimme gesprochen werden können. Es stehen verschiedene Stimmen (männlich und weiblich) zur Verfügung, die viele Sprachen und Regionen abdecken.

Durch Hinzufügen von SSML-Elementen zum Eingabetext können Sie die Stimme bearbeiten. SSML kann verwendet werden, um das Timing, die Ausdruckskraft, die Tonhöhe, die Atmungsaktivität, die Frequenz, die Aussprache und mehr zu steuern.

Diese App soll Ihnen den Einstieg erleichtern. Eine Text-zu-Sprache-App ist ein unterhaltsames Beispiel, aber die tatsächlichen Ergebnisse werden erzielt, wenn Sie diesen Code verwenden, um Ihrer eigenen Anwendung eine Stimme zu geben.

Watson Text to Speech ist in der IBM Cloud und mit dem Watson API Kit in IBM Cloud Pak for Data verfügbar. Mit IBM Cloud Pak for Data können Sie Watson Text to Speech in Ihrer eigenen privaten Cloud oder überall dort bereitstellen, wo Red Hat OpenShift ausgeführt wird.

Wenn Sie dieses Codemuster abgeschlossen haben, wissen Sie, wie Sie:

  • Abrufen und Abspielen von Audio vom Watson Text to Speech-Dienst mithilfe einer REST-API
  • Integrieren Sie den Watson Text to Speech-Dienst in eine Web-App
  • Verwenden Sie React-Komponenten und einen Node.js-Server

Flow

Generate human-like audio from text

  1. Der Benutzer gibt Text als Eingabe für die Anwendung ein (lokal ausgeführt, in IBM Cloud oder in IBM Cloud Pak for Data).
  2. Die Anwendung sendet den Text an den Text-to-Speech-Dienst.
  3. Während die Daten verarbeitet werden, gibt der Text-to-Speech-Dienst Audioinformationen zur Wiedergabe an das HTML5-Audioelement zurück.

Anweisungen

Die detaillierten Schritte für dieses Muster finden Sie in der readme Datei. Die Schritte zeigen Ihnen, wie Sie:

  1. Stellen Sie den Watson Text to Speech-Dienst bereit.
  2. Stellen Sie den Server bereit.
  3. Verwenden Sie die Web-App.

Quelle: https://developer.ibm.com/patterns/generate-human-like-audio-from-text/

Zeitstempel:

Mehr von IBM Entwickler