从文本生成类似人的音频

源节点: 749302

总结

使用Node.js和React组件,创建一个Web应用程序,该程序可以从文本生成类似人类的音频。 该应用程序使用IBM®Watson™文本到语音来提供多种声音,并支持多种语言和性别。 Watson文本到语音在IBM Cloud上可用,并且在IBM Cloud Pak™for Data上具有Watson API Kit。

课程描述

文本到语音Web应用程序由React组件和Node.js服务器构建而成,可接收文本输入并将其发送到Watson文本到语音服务,以您选择的语音说出。 可以使用各种声音(男性和女性),涵盖多种语言和地区。

通过将SSML元素添加到输入文本,您可以操纵声音。 SSML可用于控制时间,表情,音调,呼吸,速率,发音等。

该应用程序旨在帮助您入门。 文本语音转换应用程序是一个有趣的示例,但是当您使用此代码为自己的应用程序发出声音时,才会产生真正的结果。

Watson文本到语音在IBM Cloud上可用,并且在IBM Cloud Pak for Data上具有Watson API Kit。 借助IBM Cloud Pak for Data,您可以在自己的私有云上​​或运行Red Hat OpenShift的任何地方配置Watson Text to Speech。

完成此代码模式后,您将了解如何:

  • 使用REST API检索和播放Watson Text to Speech服务中的音频
  • 将Watson文本到语音服务集成到Web应用程序中
  • 使用React组件和Node.js服务器

自动化流程

Generate human-like audio from text

  1. 用户向应用程序提供一些文本作为输入(在本地,IBM Cloud或IBM Cloud Pak for Data中运行)。
  2. 该应用程序将文本发送到“文本到语音”服务。
  3. 处理数据时,“文本到语音”服务将音频信息返回到HTML5音频元素以进行播放。

说明

在中找到此模式的详细步骤 自述 文件。 这些步骤说明了如何:

  1. 设置Watson Text to Speech服务。
  2. 部署服务器。
  3. 使用网络应用。

来源:https://developer.ibm.com/patterns/generate-human-like-audio-from-text/

时间戳记:

更多来自 IBM开发人员