Generieren Sie menschenähnliches Audio aus Text

Neuauflage von Plato

Verfolger: 0

Zusammenfassung

Erstellen Sie mithilfe der Komponenten Node.js und React eine Web-App, die aus Text menschenähnliches Audio generiert. Die App verwendet IBM® Watson ™ Text to Speech, um eine Auswahl von Stimmen mit Unterstützung für mehrere Sprachen und Geschlechter bereitzustellen. Watson Text to Speech ist in der IBM Cloud und mit dem Watson API Kit in IBM Cloud Pak ™ for Data verfügbar.

Beschreibung

Die Text-to-Speech-Webanwendung wurde mit React-Komponenten und einem Node.js-Server erstellt und nimmt Texteingaben entgegen und sendet sie an den Watson Text-to-Speech-Dienst, damit sie mit der von Ihnen gewählten Stimme gesprochen werden können. Es stehen verschiedene Stimmen (männlich und weiblich) zur Verfügung, die viele Sprachen und Regionen abdecken.

Durch Hinzufügen von SSML-Elementen zum Eingabetext können Sie die Stimme bearbeiten. SSML kann verwendet werden, um das Timing, die Ausdruckskraft, die Tonhöhe, die Atmungsaktivität, die Frequenz, die Aussprache und mehr zu steuern.

Diese App soll Ihnen den Einstieg erleichtern. Eine Text-zu-Sprache-App ist ein unterhaltsames Beispiel, aber die tatsächlichen Ergebnisse werden erzielt, wenn Sie diesen Code verwenden, um Ihrer eigenen Anwendung eine Stimme zu geben.

Watson Text to Speech ist in der IBM Cloud und mit dem Watson API Kit in IBM Cloud Pak for Data verfügbar. Mit IBM Cloud Pak for Data können Sie Watson Text to Speech in Ihrer eigenen privaten Cloud oder überall dort bereitstellen, wo Red Hat OpenShift ausgeführt wird.

Wenn Sie dieses Codemuster abgeschlossen haben, wissen Sie, wie Sie:

Abrufen und Abspielen von Audio vom Watson Text to Speech-Dienst mithilfe einer REST-API
Integrieren Sie den Watson Text to Speech-Dienst in eine Web-App
Verwenden Sie React-Komponenten und einen Node.js-Server

Flow

Generate human-like audio from text

Der Benutzer gibt Text als Eingabe für die Anwendung ein (lokal ausgeführt, in IBM Cloud oder in IBM Cloud Pak for Data).
Die Anwendung sendet den Text an den Text-to-Speech-Dienst.
Während die Daten verarbeitet werden, gibt der Text-to-Speech-Dienst Audioinformationen zur Wiedergabe an das HTML5-Audioelement zurück.

Anweisungen

Die detaillierten Schritte für dieses Muster finden Sie in der readme Datei. Die Schritte zeigen Ihnen, wie Sie:

Stellen Sie den Watson Text to Speech-Dienst bereit.
Stellen Sie den Server bereit.
Verwenden Sie die Web-App.

Quelle: https://developer.ibm.com/patterns/generate-human-like-audio-from-text/

Zeitstempel: 9. Juli 2020

Mehr von IBM Entwickler

Erstellen Sie einen Assistenten zur Bewertung verschiedener Krankenversicherungspolicen

Quellcluster:

Quellcluster:

IBM Entwickler

Quellknoten: 749304

Zeitstempel: 29. Juni 2020

new-to-the-street-july-11-2021-innd-simplicity-esports-globex-data-fandom-sports-winston-gold-strikeforce-sukai.jpg

Erstellen Sie mit WhatsApp und Watson-Diensten einen dialogorientierten Voicebot

Quellcluster:

IBM Entwickler

Quellknoten: 1856777

Zeitstempel: 22. Juni 2021

Generieren Sie menschliches Audio aus Text

Neuauflage von Plato

Zusammenfassung

Beschreibung

Flow

Anweisungen

Mehr von IBM Entwickler

Erstellen Sie einen Assistenten zur Bewertung verschiedener Krankenversicherungspolicen

Verbessern Sie die Ergebnisse von Watson Discovery mithilfe von API-basiertem Relevanztraining

Objektverfolgung in Video mit OpenCV und Deep Learning

Validieren Sie Computer Vision Deep Learning-Modelle

Prognostizieren Sie betrügerische Transaktionen mit Findability Platform Predict Plus

Analysieren Sie Datenmuster, um betrügerische Versicherungsansprüche zu finden

Mit AI Einblicke in Live-Kamera-Streams und -Videos gewinnen

Erstellen Sie eine Webanwendung, um Ihren Lieferkettenbestand zu optimieren

Erstellen Sie eine Web-App mit maschinellem Lernen, um Fragen zu beantworten

Erstellen Sie ein Framework, das WhatsApp mit Watson-Diensten verbindet

Erstellen Sie einen virtuellen Versicherungsassistenten, um Ansprüche zu bearbeiten

Erstellen Sie mit WhatsApp und Watson-Diensten einen dialogorientierten Voicebot

Über uns

Vertikale Suche & Ai

Plattform

Bleiben Sie in Verbindung

Konto