AI Tom Hanks ไม่ได้เสนองานให้ฉัน แต่ฟังดูเหมือนเขาเสนอ

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

AI Tom Hanks ไม่ได้เสนองานให้ฉัน แต่ดูเหมือนว่าเขาจะทำ | พีซีเวิลด์

<!–

ภาพ: Mark Hachman / IDG ผ่าน Dreamstudio.ai

ทอม แฮงส์ไม่เพียงแค่โทรหาฉันเพื่อเสนอบทให้ฉันฟัง แต่ดูเหมือนว่าจะเป็นเช่นนั้น

นับตั้งแต่ PCWorld เริ่มครอบคลุมการเพิ่มขึ้นของ แอปพลิเคชัน AI ต่างๆ เช่น AI artฉันได้ค้นหาในที่เก็บโค้ดใน GitHub และลิงก์ภายใน Reddit ซึ่งผู้คนจะโพสต์การปรับแต่งโมเดล AI ของตนเองสำหรับแนวทางต่างๆ

โมเดลเหล่านี้บางโมเดลลงเอยในไซต์เชิงพาณิชย์ ซึ่งใช้อัลกอริทึมของตัวเองหรือดัดแปลงรูปแบบอื่นที่เผยแพร่เป็นโอเพ่นซอร์ส ตัวอย่างที่ดีของไซต์เสียง AI ที่มีอยู่คือ Uberduck.aiซึ่งนำเสนอแบบจำลองที่ตั้งโปรแกรมไว้ล่วงหน้าหลายร้อยแบบอย่างแท้จริง ป้อนข้อความในช่องข้อความและคุณสามารถให้ Elon Musk, Bill Gates, Peggy Hill, Daffy Duck, Alex Trebek, Beavis, The Joker หรือแม้แต่ Siri อ่านบทที่คุณตั้งโปรแกรมไว้ล่วงหน้าได้

เราอัปโหลด Bill Clinton ปลอมเพื่อยกย่อง PCWorld เมื่อปีที่แล้ว และโมเดลดังกล่าวฟังดูดีทีเดียว

นี่คือแบบจำลองของอดีตประธานาธิบดีของเรานั่งคุยกับ PCWorld และทานอาหารว่าง เป็นของปลอมแน่นอน

การฝึกอบรม AI เพื่อสร้างคำพูดนั้นเกี่ยวข้องกับการอัปโหลดตัวอย่างเสียงที่ชัดเจน AI "เรียนรู้" วิธีที่ผู้พูดรวมเสียงเข้ากับเป้าหมายเพื่อเรียนรู้ความสัมพันธ์เหล่านั้น ปรับปรุงเสียงให้สมบูรณ์ และเลียนแบบผลลัพธ์ หากคุณคุ้นเคยกับหนังระทึกขวัญปี 1992 ที่ยอดเยี่ยม รองเท้าผ้าใบ (ร่วมกับนักแสดงระดับแนวหน้าอย่าง Robert Redford, Sidney Poitier และ Ben Kingsley เป็นต้น) จากนั้นคุณก็ทราบเกี่ยวกับฉากที่ตัวละครจำเป็นต้อง "ถอดรหัส" รหัสผ่านเสียงไบโอเมตริกซ์ด้วยการบันทึกตัวอย่างเสียงของเสียงของเป้าหมาย . นี่แทบจะเป็นสิ่งเดียวกันทุกประการ

โดยปกติแล้ว การประกอบโมเดลเสียงที่ดีอาจใช้เวลาฝึกฝนค่อนข้างนาน โดยมีตัวอย่างยาวๆ เพื่อระบุว่าบุคคลนั้นๆ พูดอย่างไร อย่างไรก็ตาม ในช่วงไม่กี่วันที่ผ่านมา มีสิ่งใหม่เกิดขึ้น: Microsoft Vall-E เอกสารการวิจัย (พร้อมตัวอย่างจริง) ของเสียงสังเคราะห์ที่ต้องใช้เสียงต้นฉบับเพียงไม่กี่วินาทีเพื่อสร้างเสียงที่ตั้งโปรแกรมได้อย่างสมบูรณ์

โดยปกติแล้ว นักวิจัย AI และกลุ่ม AI อื่นๆ ต้องการทราบว่าโมเดล Vall-E ได้รับการเผยแพร่สู่สาธารณะแล้วหรือยัง คำตอบคือไม่ แต่คุณสามารถเล่นกับโมเดลอื่นที่เรียกว่า Tortoise ได้หากต้องการ (ผู้เขียนสังเกตว่ามันเรียกว่าเต่าเพราะมันช้า แต่ก็ได้ผล)

ฝึกเสียง AI ของคุณเองด้วยเต่า

สิ่งที่ทำให้ Tortoise น่าสนใจคือคุณสามารถฝึกโมเดลด้วยเสียงที่คุณเลือกได้ง่ายๆ เพียงแค่อัปโหลดคลิปเสียงไม่กี่คลิป เดอะ หน้าเต่า GitHub โปรดทราบว่าคุณควรมีคลิปสัก XNUMX-XNUMX คลิป ความยาวประมาณ XNUMX วินาที คุณจะต้องบันทึกเป็นไฟล์ .WAV ที่มีคุณภาพเฉพาะ

มันทำงานอย่างไร? ผ่านสาธารณูปโภคที่คุณอาจไม่รู้: Google Colab. โดยพื้นฐานแล้ว Collab เป็นบริการคลาวด์ที่ Google ให้บริการซึ่งอนุญาตให้เข้าถึงเซิร์ฟเวอร์ Python รหัสที่คุณ (หรือบุคคลอื่น) เขียนสามารถจัดเก็บเป็นสมุดบันทึก ซึ่งสามารถแชร์กับผู้ใช้ที่มีบัญชี Google ทั่วไปได้ เดอะ ทรัพยากรที่ใช้ร่วมกันของเต่าอยู่ที่นี่.

อินเทอร์เฟซดูน่ากลัว แต่ก็ไม่แย่ขนาดนั้น คุณจะต้องเข้าสู่ระบบในฐานะผู้ใช้ Google จากนั้นคุณจะต้องคลิก "เชื่อมต่อ" ที่มุมขวาบน คำเตือน แม้ว่า Colab นี้จะไม่ดาวน์โหลดอะไรลงใน Google ไดรฟ์ของคุณ แต่ Colab อื่นๆ อาจทำได้ (แม้ว่าไฟล์เสียงที่สร้างขึ้นจะถูกจัดเก็บไว้ในเบราว์เซอร์ แต่สามารถดาวน์โหลดไปยังพีซีของคุณได้) โปรดทราบว่าคุณกำลังเรียกใช้โค้ดที่คนอื่นเขียนขึ้น คุณอาจได้รับข้อความแสดงข้อผิดพลาดเนื่องจากอินพุตไม่ถูกต้องหรือเนื่องจาก Google มีปัญหาที่ส่วนหลัง เช่น ไม่มี GPU ที่พร้อมใช้งาน ทั้งหมดเป็นการทดลองเล็กน้อย

Google Collab เต่า — การทำงานร่วมกันของเต่า คลิกปุ่ม "เชื่อมต่อ" เพื่อเริ่มต้น จากนั้นคลิกไอคอน "เล่น" เล็กๆ ถัดจากบล็อกโค้ดแต่ละบล็อกตามลำดับ

Mark Hachman / IDG

โค้ดแต่ละบล็อกจะมีไอคอน "เล่น" เล็กๆ ปรากฏขึ้นเมื่อคุณเลื่อนเมาส์ไปเหนือ คุณจะต้องคลิก "เล่น" บนบล็อกโค้ดแต่ละบล็อกเพื่อเรียกใช้ โดยรอให้แต่ละบล็อกดำเนินการก่อนที่จะเรียกใช้บล็อกถัดไป

แม้ว่าเราจะไม่อธิบายถึงคำแนะนำโดยละเอียดเกี่ยวกับคุณสมบัติทั้งหมด แต่โปรดทราบว่าข้อความสีแดงนั้นผู้ใช้แก้ไขได้ เช่น ข้อความแนะนำที่คุณต้องการให้โมเดลพูด ประมาณเจ็ดช่วงตึก คุณจะมีตัวเลือกในการฝึกโมเดล คุณจะต้องตั้งชื่อโมเดล จากนั้นอัปโหลดไฟล์เสียง เมื่อเสร็จสิ้น ให้เลือกรูปแบบเสียงใหม่ในบล็อกที่สี่ รันโค้ด จากนั้นกำหนดค่าข้อความในบล็อกที่สาม วิ่ง ที่ บล็อกรหัส

หากทุกอย่างเป็นไปตามแผน คุณจะมีเอาต์พุตเสียงขนาดเล็กของเสียงตัวอย่างของคุณ มันทำงานหรือไม่ ฉันทำแบบจำลองเสียงที่รวดเร็วและสกปรกของเพื่อนร่วมงานของฉัน Gordon Mah Ung ซึ่งผลงานของเราปรากฏอยู่ใน พอดคาสต์ Nerd เต็มรูปแบบ ตลอดจนวิดีโอต่างๆ ฉันอัปโหลดตัวอย่างความยาวหลายนาทีแทนตัวอย่างสั้นๆ เพื่อดูว่าจะใช้ได้ไหม

ผลลัพธ์? ก็มัน เสียง เหมือนจริง แต่ไม่เหมือน Gordon เลย ตอนนี้เขาปลอดภัยจากการแอบอ้างทางดิจิทัลอย่างแน่นอน (นี่ไม่ใช่การรับรองห่วงโซ่อาหารฟาสต์ฟู้ดใดๆ เช่นกัน)

แต่แบบจำลองที่มีอยู่ซึ่งผู้เขียน Tortoise ฝึกฝนให้กับนักแสดง Tom Hanks ฟังดูค่อนข้างดี นี่ไม่ใช่ทอม แฮงก์พูดที่นี่! ทอมก็ทำเช่นกัน ไม่ เสนองานให้ฉัน แต่มันก็เพียงพอแล้วที่จะหลอกเพื่อนของฉันอย่างน้อยหนึ่งคน

ข้อสรุป? มันน่ากลัวเล็กน้อย: ยุคของการเชื่อในสิ่งที่เราได้ยิน (และเห็นในไม่ช้า) กำลังจะสิ้นสุดลง หรือมีอยู่แล้ว

ผู้เขียน: Mark Hachman, บรรณาธิการอาวุโส

ในฐานะบรรณาธิการอาวุโสของ PCWorld Mark มุ่งเน้นไปที่ข่าวและเทคโนโลยีชิปของ Microsoft รวมถึงจังหวะอื่นๆ เขาเคยเขียนบทให้กับ PCMag, BYTE, Slashdot, eWEEK และ ReadWrite

เรื่องล่าสุดโดย Mark Hachman:

รหัสคูปอง

เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
เพลโตบล็อคเชน Web3 Metaverse ข่าวกรอง ขยายความรู้. เข้าถึงได้ที่นี่.
ที่มา: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html

ประทับเวลา: January 13, 2023

ประทับเวลา: สิงหาคม 18, 2023

AI Tom Hanks ไม่ได้เสนองานให้ฉัน แต่ดูเหมือนว่าเขาจะเสนองานให้ฉัน

เผยแพร่ซ้ำโดยเพลโต

ฝึกเสียง AI ของคุณเองด้วยเต่า

ผู้เขียน: Mark Hachman, บรรณาธิการอาวุโส

เรื่องล่าสุดโดย Mark Hachman:

รหัสคูปอง

เพิ่มเติมจาก พีซีเวิลด์

แล็ปท็อปเล่นเกมที่ดีที่สุดราคาต่ำกว่า 1,500 ดอลลาร์: โดยรวมดีที่สุด พกพาสะดวกที่สุด และอีกมากมาย

Counter-Strike 2 อยู่ที่นี่และฟรีบน Steam

สำรวจเมืองใหม่ๆ ในปี 2023 ด้วยเอียร์บัดสำหรับแปลภาษา — ลด 55% ทันที

จะมีการเปลี่ยนแปลงครั้งใหญ่ในวิธีซื้อจอภาพในปี 2024

Google เพิ่งให้เกมเบราว์เซอร์อัปเกรดด้วย GPU ขนาดใหญ่

มอบการเรียนรู้ตลอดชีวิตในราคาเพียง $20 ในช่วงเทศกาลวันหยุดนี้

โปรแกรมป้องกันไวรัสฟรีที่ดีที่สุดสำหรับ Android

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้