IBM开发人员

从文本生成类似人的音频

AI时间戳：9年2020月12日上午00:XNUMX

源节点： 749302

由柏拉图重新发布

关注： 0

总结

使用Node.js和React组件，创建一个Web应用程序，该程序可以从文本生成类似人类的音频。该应用程序使用IBM®Watson™文本到语音来提供多种声音，并支持多种语言和性别。 Watson文本到语音在IBM Cloud上可用，并且在IBM Cloud Pak™for Data上具有Watson API Kit。

课程描述

文本到语音Web应用程序由React组件和Node.js服务器构建而成，可接收文本输入并将其发送到Watson文本到语音服务，以您选择的语音说出。可以使用各种声音（男性和女性），涵盖多种语言和地区。

通过将SSML元素添加到输入文本，您可以操纵声音。 SSML可用于控制时间，表情，音调，呼吸，速率，发音等。

该应用程序旨在帮助您入门。文本语音转换应用程序是一个有趣的示例，但是当您使用此代码为自己的应用程序发出声音时，才会产生真正的结果。

Watson文本到语音在IBM Cloud上可用，并且在IBM Cloud Pak for Data上具有Watson API Kit。借助IBM Cloud Pak for Data，您可以在自己的私有云上或运行Red Hat OpenShift的任何地方配置Watson Text to Speech。

完成此代码模式后，您将了解如何：

使用REST API检索和播放Watson Text to Speech服务中的音频
将Watson文本到语音服务集成到Web应用程序中
使用React组件和Node.js服务器

自动化流程

Generate human-like audio from text

用户向应用程序提供一些文本作为输入（在本地，IBM Cloud或IBM Cloud Pak for Data中运行）。
该应用程序将文本发送到“文本到语音”服务。
处理数据时，“文本到语音”服务将音频信息返回到HTML5音频元素以进行播放。

说明

在中找到此模式的详细步骤自述文件。这些步骤说明了如何：

设置Watson Text to Speech服务。
部署服务器。
使用网络应用。

来源：https://developer.ibm.com/patterns/generate-human-like-audio-from-text/

时间戳记： 2020 年 7 月 9 日

更多来自 IBM开发人员

建立一个助手来评估各种健康保险政策

源群集：

IBM开发人员

源节点： 747698

时间戳记： 2020 年 11 月 2 日

使用基于API的相关性培训来改善Watson Discovery结果

源群集：

IBM开发人员

源节点： 1537609

时间戳记： 2021 年 11 月 15 日

使用OpenCV和深度学习进行视频中的对象跟踪

源群集：

IBM开发人员

源节点： 749912

时间戳记： 2020 年 6 月 16 日

验证计算机视觉深度学习模型

源群集：

IBM开发人员

源节点： 749609

时间戳记： 2020 年 6 月 16 日

使用 Findability Platform Predict Plus 预测欺诈交易

源群集：

IBM开发人员

源节点： 748175

时间戳记： 2020 年 10 月 21 日

分析数据模式以查找欺诈性保险索赔

源群集：

IBM开发人员

源节点： 748954

时间戳记： 2020 年 7 月 30 日

通过AI对实时摄像头流和视频收集见解

源群集：

IBM开发人员

源节点： 748599

时间戳记： 2020 年 8 月 31 日

创建一个Web应用程序以优化您的供应链库存

源群集：

IBM开发人员

源节点： 747574

时间戳记： 2020 年 11 月 30 日

创建一个支持机器学习的Web应用程序以回答问题

源群集：

IBM开发人员

源节点： 1573047

时间戳记： 2019 年 11 月 4 日

建立将WhatsApp连接到Watson服务的框架

源群集：

IBM开发人员

源节点： 748173

时间戳记： 2020 年 10 月 22 日

构建虚拟保险助理以帮助处理索赔

源群集：

IBM开发人员

源节点： 749304

时间戳记： 2020 年 6 月 29 日

新街七月 11-2021-innd-simplicity-esports-globex-data-fandom-sports-winston-gold-strikeforce-sukai.jpg

使用 WhatsApp 和 Watson 服务创建对话式语音机器人

源群集：

IBM开发人员

源节点： 1856777

时间戳记： 2021 年 6 月 22 日