صدای انسان مانند را از متن تولید کنید

گره منبع: 749302

خلاصه

با استفاده از اجزای Node.js و React، یک برنامه وب ایجاد کنید که صدای انسان مانند را از متن تولید می کند. این برنامه از IBM® Watson™ Text to Speech برای ارائه مجموعه‌ای از صداها با پشتیبانی از چندین زبان و جنسیت استفاده می‌کند. Watson Text to Speech در IBM Cloud و با کیت Watson API در IBM Cloud Pak™ for Data در دسترس است.

توضیحات:

برنامه وب تبدیل متن به گفتار که با مؤلفه‌های React و سرور Node.js ساخته شده است، ورودی متن را دریافت می‌کند و آن را به سرویس Watson Text to Speech ارسال می‌کند تا با صدایی که انتخاب می‌کنید صحبت شود. صداهای مختلف (مرد و زن) در دسترس هستند که زبان ها و مناطق زیادی را پوشش می دهند.

با افزودن عناصر SSML به متن ورودی، می توانید صدا را دستکاری کنید. SSML می تواند برای کنترل زمان، بیان، زیر و بم، تنفس، نرخ، تلفظ و موارد دیگر استفاده شود.

این برنامه برای شروع شما در نظر گرفته شده است. برنامه تبدیل متن به گفتار مثال جالبی است، اما نتایج واقعی زمانی اتفاق می‌افتد که از این کد برای ارائه صدای برنامه خود استفاده کنید.

Watson Text to Speech در IBM Cloud و با Watson API Kit در IBM Cloud Pak for Data در دسترس است. با IBM Cloud Pak for Data، می‌توانید Watson Text to Speech را در فضای ابری خصوصی خود یا هر جایی که Red Hat OpenShift اجرا می‌شود، ارائه دهید.

هنگامی که این الگوی کد را تکمیل کردید، می فهمید که چگونه:

  • با استفاده از REST API، صدا را از سرویس Watson Text to Speech بازیابی و پخش کنید
  • سرویس Watson Text to Speech را در یک برنامه وب ادغام کنید
  • از اجزای React و سرور Node.js استفاده کنید

جریان

Generate human-like audio from text

  1. کاربر مقداری متن را به عنوان ورودی به برنامه ارائه می کند (که به صورت محلی، در IBM Cloud، یا در IBM Cloud Pak for Data اجرا می شود).
  2. برنامه متن را به سرویس Text to Speech ارسال می کند.
  3. همانطور که داده ها پردازش می شوند، سرویس Text to Speech اطلاعات صوتی را برای پخش به عنصر صوتی HTML5 برمی گرداند.

دستورالعمل ها

مراحل دقیق این الگو را در قسمت پیدا کنید صفحهی راهنمای ترجمهها فایل. مراحل به شما نشان می دهد که چگونه:

  1. ارائه سرویس متن به گفتار Watson.
  2. سرور را مستقر کنید.
  3. از برنامه وب استفاده کنید.

منبع: https://developer.ibm.com/patterns/generate-human-like-audio-from-text/

تمبر زمان:

بیشتر از توسعه دهنده IBM