สร้างเสียงเหมือนมนุษย์จากข้อความ

โหนดต้นทาง: 749302

สรุป

ใช้ Node.js และส่วนประกอบ React สร้างเว็บแอปที่สร้างเสียงเหมือนมนุษย์จากข้อความ แอปนี้ใช้ IBM® Watson™ Text to Speech เพื่อให้เสียงที่เลือกได้พร้อมการสนับสนุนหลายภาษาและเพศ Watson Text to Speech พร้อมใช้งานบน IBM Cloud และด้วย Watson API Kit บน IBM Cloud Pak™ for Data

รายละเอียด

สร้างขึ้นด้วยส่วนประกอบ React และเซิร์ฟเวอร์ Node.js เว็บแอปแปลงข้อความเป็นคำพูดรับการป้อนข้อความและส่งไปยังบริการ Watson Text to Speech เพื่อพูดด้วยเสียงที่คุณเลือก มีหลายเสียงให้เลือก (ชายและหญิง) ครอบคลุมหลายภาษาและภูมิภาค

โดยการเพิ่มองค์ประกอบ SSML ให้กับข้อความที่ป้อน คุณสามารถปรับแต่งเสียงได้ SSML สามารถใช้ควบคุมเวลา ความหมาย ระดับเสียง ความหายใจ อัตรา การออกเสียง และอื่นๆ

แอพนี้มีจุดประสงค์เพื่อให้คุณเริ่มต้น แอปแปลงข้อความเป็นคำพูดเป็นตัวอย่างที่สนุกสนาน แต่ผลลัพธ์ที่แท้จริงจะเกิดขึ้นเมื่อคุณใช้โค้ดนี้เพื่อให้แอปพลิเคชันของคุณมีเสียง

Watson Text to Speech พร้อมใช้งานบน IBM Cloud และ Watson API Kit บน IBM Cloud Pak for Data ด้วย IBM Cloud Pak for Data คุณสามารถจัดเตรียม Watson Text to Speech บนคลาวด์ส่วนตัวของคุณเองหรือที่ใดก็ตามที่ Red Hat OpenShift ทำงาน

เมื่อคุณเสร็จสิ้นรูปแบบโค้ดนี้ คุณจะเข้าใจวิธี:

  • ดึงและเล่นเสียงจากบริการ Watson Text to Speech โดยใช้ REST API
  • รวมบริการข้อความเป็นคำพูดของวัตสันในเว็บแอป
  • ใช้ส่วนประกอบ React และเซิร์ฟเวอร์ Node.js

ไหล

Generate human-like audio from text

  1. ผู้ใช้ระบุข้อความบางส่วนเป็นอินพุตไปยังแอปพลิเคชัน (รันในเครื่อง ใน IBM Cloud หรือใน IBM Cloud Pak for Data)
  2. แอปพลิเคชั่นส่งข้อความไปยังบริการ Text to Speech
  3. เมื่อข้อมูลได้รับการประมวลผล บริการ Text to Speech จะส่งคืนข้อมูลเสียงไปยังองค์ประกอบเสียง HTML5 เพื่อเล่น

คำแนะนำ

ค้นหาขั้นตอนโดยละเอียดสำหรับรูปแบบนี้ใน README ไฟล์. ขั้นตอนแสดงวิธีการ:

  1. จัดเตรียมบริการข้อความเป็นคำพูดของวัตสัน
  2. ปรับใช้เซิร์ฟเวอร์
  3. ใช้เว็บแอป

ที่มา: https://developer.ibm.com/patterns/generate-human-like-audio-from-text/

ประทับเวลา:

เพิ่มเติมจาก นักพัฒนาไอบีเอ็ม