Генерировать похожий на человека звук из текста

Исходный узел: 749302

Обзор

Используя компоненты Node.js и React, создайте веб-приложение, которое генерирует похожий на человека звук из текста. Приложение использует IBM® Watson ™ Text to Speech, чтобы обеспечить выбор голосов с поддержкой нескольких языков и полов. Программа Watson Text to Speech доступна в IBM Cloud и вместе с Watson API Kit для IBM Cloud Pak ™ для данных.

Описание

Созданное с использованием компонентов React и сервера Node.js, веб-приложение преобразования текста в речь принимает текстовый ввод и отправляет его в службу Watson Text to Speech для произнесения голоса выбранным вами голосом. Доступны различные голоса (мужские и женские), охватывающие многие языки и регионы.

Добавляя элементы SSML во входной текст, вы можете управлять голосом. SSML может использоваться для контроля времени, выразительности, высоты тона, дыхания, скорости, произношения и многого другого.

Это приложение предназначено, чтобы вы начали. Приложение преобразования текста в речь - забавный пример, но реальные результаты достигаются, когда вы используете этот код для придания голосу своему приложению.

Программа Watson Text to Speech доступна в IBM Cloud и вместе с Watson API Kit для IBM Cloud Pak для данных. С помощью IBM Cloud Pak for Data вы можете предоставлять Watson Text to Speech в своем собственном частном облаке или везде, где работает Red Hat OpenShift.

Когда вы завершили этот шаблон кода, вы понимаете, как:

  • Извлекать и воспроизводить аудио из службы Watson Text to Speech с помощью REST API
  • Интеграция службы Watson Text to Speech в веб-приложение
  • Используйте компоненты React и сервер Node.js

Поток

Generate human-like audio from text

  1. Пользователь вводит некоторый текст в качестве ввода в приложение (работает локально, в IBM Cloud или в IBM Cloud Pak для данных).
  2. Приложение отправляет текст в службу «Текст в речь».
  3. По мере обработки данных служба преобразования текста в речь возвращает аудиоинформацию в аудиоэлемент HTML5 для воспроизведения.

инструкции

Найти подробные шаги для этого шаблона в ридми файл. Шаги показывают вам, как:

  1. Предоставление услуги Watson Text to Speech.
  2. Разверните сервер.
  3. Используйте веб-приложение.

Источник: https://developer.ibm.com/patterns/generate-human-like-audio-from-text/

Отметка времени:

Больше от Разработчик IBM