Обзор
Используя компоненты Node.js и React, создайте веб-приложение, которое генерирует похожий на человека звук из текста. Приложение использует IBM® Watson ™ Text to Speech, чтобы обеспечить выбор голосов с поддержкой нескольких языков и полов. Программа Watson Text to Speech доступна в IBM Cloud и вместе с Watson API Kit для IBM Cloud Pak ™ для данных.
Описание
Созданное с использованием компонентов React и сервера Node.js, веб-приложение преобразования текста в речь принимает текстовый ввод и отправляет его в службу Watson Text to Speech для произнесения голоса выбранным вами голосом. Доступны различные голоса (мужские и женские), охватывающие многие языки и регионы.
Добавляя элементы SSML во входной текст, вы можете управлять голосом. SSML может использоваться для контроля времени, выразительности, высоты тона, дыхания, скорости, произношения и многого другого.
Это приложение предназначено, чтобы вы начали. Приложение преобразования текста в речь - забавный пример, но реальные результаты достигаются, когда вы используете этот код для придания голосу своему приложению.
Программа Watson Text to Speech доступна в IBM Cloud и вместе с Watson API Kit для IBM Cloud Pak для данных. С помощью IBM Cloud Pak for Data вы можете предоставлять Watson Text to Speech в своем собственном частном облаке или везде, где работает Red Hat OpenShift.
Когда вы завершили этот шаблон кода, вы понимаете, как:
- Извлекать и воспроизводить аудио из службы Watson Text to Speech с помощью REST API
- Интеграция службы Watson Text to Speech в веб-приложение
- Используйте компоненты React и сервер Node.js
Поток
- Пользователь вводит некоторый текст в качестве ввода в приложение (работает локально, в IBM Cloud или в IBM Cloud Pak для данных).
- Приложение отправляет текст в службу «Текст в речь».
- По мере обработки данных служба преобразования текста в речь возвращает аудиоинформацию в аудиоэлемент HTML5 для воспроизведения.
инструкции
Найти подробные шаги для этого шаблона в ридми файл. Шаги показывают вам, как:
- Предоставление услуги Watson Text to Speech.
- Разверните сервер.
- Используйте веб-приложение.
Источник: https://developer.ibm.com/patterns/generate-human-like-audio-from-text/