צור אודיו דמוי אדם מטקסט

צומת המקור: 749302

<br> סיכום

באמצעות רכיבי Node.js ו- React, צור אפליקציית אינטרנט המייצרת אודיו דמוי אדם מטקסט. האפליקציה משתמשת בטקסט של IBM® Watson ™ לדיבור בכדי לספק מבחר קולות עם תמיכה במספר שפות ומגדרים. טקסט לדיבור של ווטסון זמין ב- IBM Cloud ועם ערכת ה- API של Watson ב- IBM Cloud Pak ™ לנתונים.

תיאור

בניית רכיבי React ושרת Node.js, אפליקציית האינטרנט טקסט לדיבור לוקחת קלט טקסט ושולחת אותו לשירות Watson Text to Speech כדי להיות מדוברים בקול שתבחר. קיימים קולות שונים (זכר ונקבה) המשתרעים על שפות ואזורים רבים.

על ידי הוספת אלמנטים של SSML לטקסט הקלט, אתה יכול לתפעל את הקול. ניתן להשתמש ב- SSML כדי לשלוט על התזמון, האקספרסיביות, המגרש, הנשימה, הקצב, ההגייה ועוד.

האפליקציה הזו מיועדת להתחיל. אפליקציית טקסט לדיבור היא דוגמה מהנה, אך התוצאות האמיתיות מתרחשות כשאתה משתמש בקוד זה כדי לתת לאפליקציה שלך קול.

טקסט לדיבור של ווטסון זמין ב- IBM Cloud ועם ערכת ה- API של Watson ב- IBM Cloud Pak לנתונים. עם IBM Cloud Pak for Data, אתה יכול לספק טקסט ווטסון לדיבור בענן הפרטי שלך או בכל מקום בו Red Hat OpenShift פועל.

לאחר השלמת דפוס קוד זה, אתה מבין כיצד:

  • אחזר והשמע שמע משירות Watson Text to Speech באמצעות ממשק API REST
  • שלב את שירות הטקסט ווטסון לדיבור באפליקציית אינטרנט
  • השתמש ברכיבי React ובשרת Node.js

זרימה

Generate human-like audio from text

  1. המשתמש מספק טקסט כלשהו כקלט ליישום (פועל באופן מקומי, ב- IBM Cloud או ב- IBM Cloud Pak for Data).
  2. היישום שולח את הטקסט לשירות טקסט לדיבור.
  3. במהלך עיבוד הנתונים, שירות טקסט לדיבור מחזיר מידע שמע לרכיב השמע HTML5 להפעלה.

הוראות

מצא את הצעדים המפורטים לדפוס זה בסעיף readme קובץ. השלבים מראים כיצד:

  1. לספק שירות טקסט טקסט לדיבור של ווטסון.
  2. פרוס את השרת.
  3. השתמש באפליקציית האינטרנט.

מקור: https://developer.ibm.com/patterns/generate-human-like-audio-from-text/

בול זמן:

עוד מ מפתח יבמ