Generate Human-like Audio From Text

Переиздано Платоном

Читают: 0

Обзор

Используя компоненты Node.js и React, создайте веб-приложение, которое генерирует похожий на человека звук из текста. Приложение использует IBM® Watson ™ Text to Speech, чтобы обеспечить выбор голосов с поддержкой нескольких языков и полов. Программа Watson Text to Speech доступна в IBM Cloud и вместе с Watson API Kit для IBM Cloud Pak ™ для данных.

Описание

Созданное с использованием компонентов React и сервера Node.js, веб-приложение преобразования текста в речь принимает текстовый ввод и отправляет его в службу Watson Text to Speech для произнесения голоса выбранным вами голосом. Доступны различные голоса (мужские и женские), охватывающие многие языки и регионы.

Добавляя элементы SSML во входной текст, вы можете управлять голосом. SSML может использоваться для контроля времени, выразительности, высоты тона, дыхания, скорости, произношения и многого другого.

Это приложение предназначено, чтобы вы начали. Приложение преобразования текста в речь - забавный пример, но реальные результаты достигаются, когда вы используете этот код для придания голосу своему приложению.

Программа Watson Text to Speech доступна в IBM Cloud и вместе с Watson API Kit для IBM Cloud Pak для данных. С помощью IBM Cloud Pak for Data вы можете предоставлять Watson Text to Speech в своем собственном частном облаке или везде, где работает Red Hat OpenShift.

Когда вы завершили этот шаблон кода, вы понимаете, как:

Извлекать и воспроизводить аудио из службы Watson Text to Speech с помощью REST API
Интеграция службы Watson Text to Speech в веб-приложение
Используйте компоненты React и сервер Node.js

Поток

Generate human-like audio from text

Пользователь вводит некоторый текст в качестве ввода в приложение (работает локально, в IBM Cloud или в IBM Cloud Pak для данных).
Приложение отправляет текст в службу «Текст в речь».
По мере обработки данных служба преобразования текста в речь возвращает аудиоинформацию в аудиоэлемент HTML5 для воспроизведения.