خلاصه
با استفاده از اجزای Node.js و React، یک برنامه وب ایجاد کنید که صدای انسان مانند را از متن تولید می کند. این برنامه از IBM® Watson™ Text to Speech برای ارائه مجموعهای از صداها با پشتیبانی از چندین زبان و جنسیت استفاده میکند. Watson Text to Speech در IBM Cloud و با کیت Watson API در IBM Cloud Pak™ for Data در دسترس است.
توضیحات:
برنامه وب تبدیل متن به گفتار که با مؤلفههای React و سرور Node.js ساخته شده است، ورودی متن را دریافت میکند و آن را به سرویس Watson Text to Speech ارسال میکند تا با صدایی که انتخاب میکنید صحبت شود. صداهای مختلف (مرد و زن) در دسترس هستند که زبان ها و مناطق زیادی را پوشش می دهند.
با افزودن عناصر SSML به متن ورودی، می توانید صدا را دستکاری کنید. SSML می تواند برای کنترل زمان، بیان، زیر و بم، تنفس، نرخ، تلفظ و موارد دیگر استفاده شود.
این برنامه برای شروع شما در نظر گرفته شده است. برنامه تبدیل متن به گفتار مثال جالبی است، اما نتایج واقعی زمانی اتفاق میافتد که از این کد برای ارائه صدای برنامه خود استفاده کنید.
Watson Text to Speech در IBM Cloud و با Watson API Kit در IBM Cloud Pak for Data در دسترس است. با IBM Cloud Pak for Data، میتوانید Watson Text to Speech را در فضای ابری خصوصی خود یا هر جایی که Red Hat OpenShift اجرا میشود، ارائه دهید.
هنگامی که این الگوی کد را تکمیل کردید، می فهمید که چگونه:
- با استفاده از REST API، صدا را از سرویس Watson Text to Speech بازیابی و پخش کنید
- سرویس Watson Text to Speech را در یک برنامه وب ادغام کنید
- از اجزای React و سرور Node.js استفاده کنید
جریان
- کاربر مقداری متن را به عنوان ورودی به برنامه ارائه می کند (که به صورت محلی، در IBM Cloud، یا در IBM Cloud Pak for Data اجرا می شود).
- برنامه متن را به سرویس Text to Speech ارسال می کند.
- همانطور که داده ها پردازش می شوند، سرویس Text to Speech اطلاعات صوتی را برای پخش به عنصر صوتی HTML5 برمی گرداند.
دستورالعمل ها
مراحل دقیق این الگو را در قسمت پیدا کنید صفحهی راهنمای ترجمهها فایل. مراحل به شما نشان می دهد که چگونه:
- ارائه سرویس متن به گفتار Watson.
- سرور را مستقر کنید.
- از برنامه وب استفاده کنید.
منبع: https://developer.ibm.com/patterns/generate-human-like-audio-from-text/