->
الصورة: مارك هاتشمان / آي دي جي عبر Dreamstudio.ai
لم يتصل بي توم هانكس فقط ليعرض علي جزءًا ، لكنه بالتأكيد يبدو كذلك.
منذ أن بدأ PCWorld في تغطية صعود مختلف تطبيقات الذكاء الاصطناعي مثل فن الذكاء الاصطناعي، لقد كنت أتجول في مستودعات الأكواد في GitHub والروابط داخل Reddit ، حيث سينشر الأشخاص تعديلات على نماذج الذكاء الاصطناعي الخاصة بهم من أجل مناهج مختلفة.
ينتهي المطاف ببعض هذه النماذج في الواقع في مواقع تجارية ، والتي إما تقوم بتدوير خوارزمياتها الخاصة أو تكييف أخرى تم نشرها كمصدر مفتوح. من الأمثلة الرائعة على موقع صوتي موجود بالذكاء الاصطناعي Uberduck.ai، والتي تقدم مئات النماذج المبرمجة مسبقًا. أدخل النص في حقل النص ويمكنك الحصول على Elon Musk أو Bill Gates أو Peggy Hill أو Daffy Duck أو Alex Trebek أو Beavis أو The Joker أو حتى Siri ظاهريًا لقراءة الأسطر المبرمجة مسبقًا.
لقد قمنا بتحميل صورة مزيفة لبيل كلينتون تشيد بـ PCWorld العام الماضي ويبدو النموذج بالفعل جيدًا جدًا.
يتضمن تدريب الذكاء الاصطناعي على إعادة إنتاج الكلام تحميل عينات صوت واضحة. يتعلم الذكاء الاصطناعي كيف يجمع المتحدث الأصوات مع الهدف في تعلم تلك العلاقات ، وإتقانها ، وتقليد النتائج. إذا كنت معتادًا على فيلم الإثارة الرائع لعام 1992 أحذية (مع طاقم كل النجوم من روبرت ريدفورد وسيدني بواتييه وبن كينجسلي ، من بين آخرين) ، فأنت تعرف المشهد الذي تحتاج فيه الشخصيات إلى "كسر" كلمة مرور صوتية بيومترية من خلال تسجيل عينة صوتية من صوت الهدف . هذا هو نفس الشيء تقريبا.
عادة ، يمكن أن يستغرق تجميع نموذج صوتي جيد قدرًا كبيرًا من التدريب ، مع عينات مطولة للإشارة إلى كيفية تحدث شخص معين. ومع ذلك ، ظهر شيء جديد في الأيام القليلة الماضية: Microsoft Vall-E ، ورقة بحثية (مع أمثلة حية) لصوت مُركَّب لا يتطلب سوى بضع ثوانٍ من صوت المصدر لتوليد صوت قابل للبرمجة بالكامل.
بطبيعة الحال ، أراد باحثو الذكاء الاصطناعي ومجموعات الذكاء الاصطناعي الأخرى معرفة ما إذا كان نموذج Vall-E قد تم طرحه للجمهور بعد. الإجابة هي لا ، على الرغم من أنه يمكنك اللعب بنموذج آخر ، إذا كنت ترغب في ذلك ، يسمى السلحفاة. (يلاحظ المؤلف أنها تسمى السلحفاة لأنها بطيئة ، وهي كذلك ، لكنها تعمل.)
تدريب صوت AI الخاص بك مع السلحفاة
ما يجعل السلحفاة مثيرة للاهتمام هو أنه يمكنك تدريب النموذج على أي صوت تختاره ببساطة عن طريق تحميل بعض المقاطع الصوتية. ال صفحة السلحفاة على GitHub يشير إلى أنه يجب أن يكون لديك بضع مقاطع من حوالي اثنتي عشرة ثانية أو نحو ذلك. ستحتاج إلى حفظها كملف WAV بجودة معينة.
كيف يعمل هذا كله؟ من خلال مرفق عام قد لا تكون على دراية به: جوجل كولاب. في الأساس ، Collab هي خدمة سحابية توفرها Google وتسمح بالوصول إلى خادم Python. يمكن تخزين الكود الذي تكتبه (أو أي شخص آخر) كدفتر ملاحظات ، والذي يمكن مشاركته مع المستخدمين الذين لديهم حساب Google عام. ال المورد المشترك السلحفاة هنا.
تبدو الواجهة مخيفة ، لكنها ليست بهذا السوء. ستحتاج إلى تسجيل الدخول كمستخدم Google ثم ستحتاج إلى النقر فوق "اتصال" في الزاوية العلوية اليمنى. كلمة للتحذير. بينما لا يقوم Colab بتنزيل أي شيء على Google Drive الخاص بك ، إلا أن Colabs الأخرى قد تقوم بذلك. (على الرغم من ذلك ، يتم تخزين الملفات الصوتية التي يتم إنشاؤها في المتصفح ولكن يمكن تنزيلها على جهاز الكمبيوتر الخاص بك.) كن على علم بأنك تقوم بتشغيل رمز كتبه شخص آخر. قد تتلقى رسائل خطأ إما بسبب المدخلات السيئة أو لأن Google بها عطل في النهاية الخلفية مثل عدم وجود وحدة معالجة رسومات متاحة. كل شيء تجريبي بعض الشيء.
يحتوي كل جزء من الكود على رمز "تشغيل" صغير يظهر عند تحريك الماوس فوقه. ستحتاج إلى النقر فوق "تشغيل" على كل كتلة من التعليمات البرمجية لتشغيلها ، في انتظار تنفيذ كل كتلة قبل تشغيل التالي.
على الرغم من أننا لن نخطو عبر الإرشادات التفصيلية حول جميع الميزات ، فقط كن على دراية بأن النص الأحمر قابل للتعديل من قبل المستخدم ، مثل النص المقترح الذي تريد أن يتحدث به النموذج. على بعد حوالي سبع كتل ، سيكون لديك خيار تدريب النموذج. ستحتاج إلى تسمية النموذج ، ثم تحميل الملفات الصوتية. عند اكتمال ذلك ، حدد نموذج الصوت الجديد في الكتلة الرابعة ، وقم بتشغيل الكود ، ثم قم بتكوين النص في الكتلة الثالثة. يجري أن كتلة التعليمات البرمجية.
إذا سارت الأمور كما هو مخطط لها ، فسيكون لديك إخراج صوتي صغير من عينة صوتك. هل يعمل؟ حسنًا ، لقد قدمت نموذجًا صوتيًا سريعًا وقذرًا لزميلي جوردون ماه أونج ، الذي يظهر عمله في البودكاست الطالب الذي يذاكر كثيرا بالإضافة إلى مقاطع فيديو مختلفة. لقد قمت بتحميل عينة مدتها عدة دقائق بدلاً من المقتطفات القصيرة ، فقط لمعرفة ما إذا كانت ستنجح.
النتائج؟ حسنًا ، هذا الأصوات نابض بالحياة ، ولكن ليس مثل جوردون على الإطلاق. إنه بالتأكيد في مأمن من انتحال الهوية الرقمي في الوقت الحالي. (هذا ليس تأييدًا لأي سلسلة مطاعم للوجبات السريعة أيضًا).
لكن النموذج الحالي الذي دربه مؤلف السلحفاة على الممثل توم هانكس يبدو جيدًا جدًا. هذا ليس توم هانكس يتحدث هنا! كما فعل توم ليس عرض لي وظيفة ، لكن كان ذلك كافياً لخداع أحد أصدقائي على الأقل.
الإستنتاج؟ إنه أمر مخيف بعض الشيء: عصر تصديق ما نسمعه (وسرعان ما نراه) ينتهي. أو لديها بالفعل.
رموز القسيمة
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- بلاتوبلوكشين. Web3 Metaverse Intelligence. تضخيم المعرفة. الوصول هنا.
- المصدر https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html
- 1
- 2023
- 39
- a
- من نحن
- الوصول
- حسابي
- في الواقع
- تكيف
- AI
- اليكس
- خوارزميات
- الكل
- يسمح
- سابقا
- من بين
- amp
- و
- آخر
- إجابة
- التطبيقات
- اقتراب
- حول
- البند
- مصطنع
- سمعي
- المؤلفة
- متاح
- الى الخلف
- سيئة
- لان
- قبل
- بدأ
- الاعتقاد
- مشروع قانون
- بيل كلينتون
- بيل غيتس
- بصمات
- قطعة
- حظر
- Blocks
- المتصفح
- زر
- دعوة
- تسمى
- فيزا وماستركارد
- الفئة
- بالتأكيد
- سلسلة
- الأحرف
- رقاقة
- اختار
- واضح
- مقاطع
- سحابة
- الكود
- الزميل
- يجمع بين
- تعليقات
- تجاري
- يكمل
- اختتام
- ضوابط
- زاوية
- الدورة
- تغطية
- ائتمان
- CSS
- التاريخ
- أيام
- وصف
- مفصلة
- فعل
- رقمي
- لا
- إلى أسفل
- بإمكانك تحميله
- دزينة
- قيادة
- كل
- رئيس التحرير
- إما
- ايلون
- إيلون ماسك
- ظهرت
- كاف
- أدخل
- خطأ
- أساسيا
- الأثير (ETH)
- حتى
- كل شىء
- مثال
- أمثلة
- ممتاز
- تنفيذ
- القائمة
- زائف
- مألوف
- المميزات
- قليل
- حقل
- قم بتقديم
- ملفات
- ويركز
- اتباع
- سابق
- سابقا
- رابع
- الاصدقاء
- تبدأ من
- بالإضافة إلى
- تماما
- البوابات و حواجز اللعب
- توليد
- يولد
- دولار فقط واحصل على خصم XNUMX% على جميع
- الحصول على
- GitHub جيثب:
- هدف
- يذهب
- الذهاب
- خير
- شراء مراجعات جوجل
- وحدة معالجة الرسوميات:
- عظيم
- وجود
- ارتفاع
- تحوم
- كيفية
- لكن
- HTML
- HTTPS
- الانسان
- مئات
- اي كون
- صورة
- in
- مؤشر
- تشير
- تعليمات
- وكتابة مواضيع مثيرة للاهتمام
- السطح البيني
- ترهب، تخوف
- IT
- يناير
- وظيفة
- مهرج
- علم
- كبير
- اسم العائلة
- العام الماضي
- تعلم
- خطوط
- وصلات
- القليل
- حي
- تبدو
- يصنع
- مدير
- علامة
- مصفوفة
- ماكس العرض
- رسائل
- مایکروسافت
- ربما
- دقائق
- مرآة
- نموذج
- عارضات ازياء
- مسك
- الاسم
- حاجة
- جديد
- أخبار
- التالي
- مفكرة
- ملاحظة
- عرض
- عروض
- ONE
- جاكيت
- المصدر المفتوح
- الأمثل
- خيار
- أخرى
- أخرى
- الخاصة
- جزء
- خاص
- كلمة المرور
- الماضي
- PC
- مجتمع
- استكمال
- شخص
- الشخصية
- رمية
- مخطط
- أفلاطون
- الذكاء افلاطون البيانات
- أفلاطون داتا
- بلايستشن
- المساعد
- منشور
- بريميوم
- رئيس
- جميل
- ابتدائي
- ملفي الشخصي
- ويوفر
- جمهور
- نشرت
- بايثون
- جودة
- عرض
- نادي القراءة
- تسلم
- الأخيرة
- تسجيل
- أحمر
- رديت
- العلاقات
- صدر
- يتطلب
- بحث
- الباحثين
- مورد
- نتيجة
- النتائج
- ارتفاع
- ROBERT
- رجل الالي
- الروبوتات
- لفة
- يجري
- تشغيل
- خزنة
- نفسه
- حفظ
- مشهد
- ثواني
- كبير
- SEO
- الخدمة
- خدماتنا
- سبعة
- شاركت
- قصير
- ينبغي
- ببساطة
- منذ
- عزباء
- سيري
- الموقع
- المواقع
- جلسة
- بطيء
- صغير
- So
- تطبيقات الكمبيوتر
- شخص ما
- شيء
- قريبا
- مصدر
- تحدث
- مكبرات الصوت
- تحدث
- يتحدث
- محدد
- خطاب
- بداية
- بدأت
- خطوة
- تخزين
- قصص
- هذه
- جدول
- TAG
- أخذ
- تكنولوجيا
- •
- من مشاركة
- شيء
- الثالث
- عبر
- الوقت
- عنوان
- إلى
- جدا
- قطار
- متدرب
- قادة الإيمان
- منعطف أو دور
- أو تويتر
- تم التحميل
- تحميل
- URL
- مستخدم
- المستخدمين
- سهل حياتك
- مختلف
- الإصدار
- بواسطة
- مقاطع فيديو
- افتراضي
- صوت
- * أصوات
- W
- انتظار
- مطلوب
- تحذير
- ابحث عن
- التي
- في حين
- من الذى
- سوف
- في غضون
- كلمة
- للعمل
- أعمال
- سوف
- مكتوب
- عام
- حل متجر العقارات الشامل الخاص بك في جورجيا
- موقع YouTube
- زفيرنت