总结
使用Node.js和React组件,创建一个Web应用程序,该程序可以从文本生成类似人类的音频。 该应用程序使用IBM®Watson™文本到语音来提供多种声音,并支持多种语言和性别。 Watson文本到语音在IBM Cloud上可用,并且在IBM Cloud Pak™for Data上具有Watson API Kit。
课程描述
文本到语音Web应用程序由React组件和Node.js服务器构建而成,可接收文本输入并将其发送到Watson文本到语音服务,以您选择的语音说出。 可以使用各种声音(男性和女性),涵盖多种语言和地区。
通过将SSML元素添加到输入文本,您可以操纵声音。 SSML可用于控制时间,表情,音调,呼吸,速率,发音等。
该应用程序旨在帮助您入门。 文本语音转换应用程序是一个有趣的示例,但是当您使用此代码为自己的应用程序发出声音时,才会产生真正的结果。
Watson文本到语音在IBM Cloud上可用,并且在IBM Cloud Pak for Data上具有Watson API Kit。 借助IBM Cloud Pak for Data,您可以在自己的私有云上或运行Red Hat OpenShift的任何地方配置Watson Text to Speech。
完成此代码模式后,您将了解如何:
- 使用REST API检索和播放Watson Text to Speech服务中的音频
- 将Watson文本到语音服务集成到Web应用程序中
- 使用React组件和Node.js服务器
自动化流程
- 用户向应用程序提供一些文本作为输入(在本地,IBM Cloud或IBM Cloud Pak for Data中运行)。
- 该应用程序将文本发送到“文本到语音”服务。
- 处理数据时,“文本到语音”服务将音频信息返回到HTML5音频元素以进行播放。
说明
在中找到此模式的详细步骤 自述 文件。 这些步骤说明了如何:
- 设置Watson Text to Speech服务。
- 部署服务器。
- 使用网络应用。
来源:https://developer.ibm.com/patterns/generate-human-like-audio-from-text/