->
تصویر: Mark Hachman / IDG بذریعہ Dreamstudio.ai
ٹام ہینکس نے مجھے صرف ایک حصہ بنانے کے لیے نہیں بلایا، لیکن یہ یقینی طور پر ایسا لگتا ہے۔
جب سے PCWorld نے عروج کا احاطہ کرنا شروع کیا ہے۔ مختلف AI ایپلی کیشنز جیسے AI آرٹ، میں GitHub میں کوڈ ریپوزٹریز اور Reddit کے اندر موجود لنکس میں گھوم رہا ہوں، جہاں لوگ مختلف طریقوں کے لیے اپنے AI ماڈلز میں ٹویکس پوسٹ کریں گے۔
ان میں سے کچھ ماڈل دراصل تجارتی سائٹس پر ختم ہوتے ہیں، جو یا تو اپنے الگورتھم کو رول کرتی ہیں یا دوسروں کو اپناتی ہیں جو اوپن سورس کے طور پر شائع ہوئے ہیں۔ موجودہ AI آڈیو سائٹ کی ایک عمدہ مثال ہے۔ Uberduck.ai، جو لفظی طور پر سینکڑوں پری پروگرامڈ ماڈل پیش کرتا ہے۔ ٹیکسٹ فیلڈ میں متن درج کریں اور آپ کے پاس ورچوئل ایلون مسک، بل گیٹس، پیگی ہل، ڈیفی ڈک، ایلکس ٹریبیک، بیویس، دی جوکر، یا یہاں تک کہ سری آپ کی پہلے سے پروگرام شدہ لائنیں پڑھ سکتے ہیں۔
ہم نے پچھلے سال PCWorld کی تعریف کرتے ہوئے ایک جعلی بل کلنٹن اپ لوڈ کیا تھا اور ماڈل پہلے ہی بہت اچھا لگتا ہے۔
تقریر کو دوبارہ تیار کرنے کے لیے AI کو تربیت دینے میں آواز کے واضح نمونے اپ لوڈ کرنا شامل ہے۔ AI "سیکھتا ہے" کہ اسپیکر ان رشتوں کو سیکھنے، انہیں مکمل کرنے اور نتائج کی نقل کرنے کے مقصد کے ساتھ آوازوں کو کس طرح جوڑتا ہے۔ اگر آپ 1992 کے بہترین تھرلر سے واقف ہیں۔ جوتے (رابرٹ ریڈفورڈ، سڈنی پوئٹیر، اور بین کنگسلے کی آل اسٹار کاسٹ کے ساتھ، دوسروں کے درمیان)، پھر آپ اس منظر کے بارے میں جانتے ہیں جس میں کرداروں کو ہدف کی آواز کا صوتی نمونہ ریکارڈ کرکے بائیو میٹرک وائس پاس ورڈ کو "کریک" کرنے کی ضرورت ہوتی ہے۔ . یہ تقریباً ایک ہی چیز ہے۔
عام طور پر، ایک اچھی آواز کے ماڈل کو جمع کرنے میں کافی تربیت لگ سکتی ہے، جس میں لمبے نمونوں کے ساتھ یہ بتانے کے لیے کہ کوئی خاص شخص کس طرح بولتا ہے۔ تاہم گزشتہ چند دنوں میں ایک نئی چیز سامنے آئی ہے: Microsoft Val-E، ایک تحقیقی مقالہ (لائیو مثالوں کے ساتھ) ایک ترکیب شدہ آواز کی جس میں مکمل طور پر قابل پروگرام آواز پیدا کرنے کے لیے صرف چند سیکنڈ کے سورس آڈیو کی ضرورت ہوتی ہے۔
قدرتی طور پر، AI محققین اور دیگر AI گروپ یہ جاننا چاہتے تھے کہ آیا Val-E ماڈل کو ابھی تک عوام کے لیے جاری کیا گیا ہے۔ جواب نہیں ہے، اگرچہ آپ چاہیں تو کسی دوسرے ماڈل کے ساتھ کھیل سکتے ہیں، جسے ٹورٹوائز کہتے ہیں۔ (مصنف نے نوٹ کیا ہے کہ اسے کچھوا کہا جاتا ہے کیونکہ یہ سست ہے، جو یہ ہے، لیکن یہ کام کرتا ہے۔)
کچھوے کے ساتھ اپنی خود کی AI آواز کو تربیت دیں۔
جو چیز کچھوے کو دلچسپ بناتی ہے وہ یہ ہے کہ آپ صرف چند آڈیو کلپس اپ لوڈ کرکے ماڈل کو جو بھی آواز منتخب کرتے ہیں اس پر تربیت دے سکتے ہیں۔ دی ٹورٹوائز گٹ ہب صفحہ نوٹ کریں کہ آپ کے پاس تقریباً ایک درجن سیکنڈ یا اس سے زیادہ کے چند کلپس ہونے چاہئیں۔ آپ کو انہیں ایک مخصوص معیار کے ساتھ .WAV فائل کے طور پر محفوظ کرنے کی ضرورت ہوگی۔
یہ سب کیسے کام کرتا ہے؟ ایک عوامی افادیت کے ذریعے جس کے بارے میں آپ کو شاید معلوم نہ ہو: گوگل کولاب۔. بنیادی طور پر، Collab ایک کلاؤڈ سروس ہے جو Google فراہم کرتا ہے جو Python سرور تک رسائی کی اجازت دیتا ہے۔ آپ (یا کوئی اور) جو کوڈ لکھتے ہیں اسے ایک نوٹ بک کے طور پر اسٹور کیا جا سکتا ہے، جس کا اشتراک ان صارفین کے ساتھ کیا جا سکتا ہے جن کے پاس عام Google اکاؤنٹ ہے۔ دی کچھوے کا مشترکہ وسیلہ یہاں ہے۔.
انٹرفیس خوفناک لگتا ہے، لیکن یہ اتنا برا نہیں ہے۔ آپ کو گوگل صارف کے طور پر لاگ ان ہونے کی ضرورت ہوگی اور پھر آپ کو اوپری دائیں کونے میں "کنیکٹ" پر کلک کرنے کی ضرورت ہوگی۔ انتباہ کا ایک لفظ۔ اگرچہ یہ Colab آپ کی Google Drive پر کچھ بھی ڈاؤن لوڈ نہیں کرتا، دوسرے Colabs ہو سکتا ہے۔ (اگرچہ یہ آڈیو فائلیں جنریٹ کرتی ہیں، براؤزر میں محفوظ ہیں لیکن آپ کے کمپیوٹر پر ڈاؤن لوڈ کی جا سکتی ہیں۔) آگاہ رہیں کہ آپ کوڈ چلا رہے ہیں جو کسی اور نے لکھا ہے۔ آپ کو خراب ان پٹس کی وجہ سے یا گوگل کے پچھلے حصے میں ایک ہچکی ہے جیسے کہ GPU دستیاب نہ ہونے کی وجہ سے خرابی کے پیغامات موصول ہو سکتے ہیں۔ یہ سب کچھ تھوڑا تجرباتی ہے۔
کوڈ کے ہر بلاک میں ایک چھوٹا "پلے" آئیکن ہوتا ہے جو ظاہر ہوتا ہے اگر آپ اپنے ماؤس کو اس پر گھماتے ہیں۔ آپ کو کوڈ کے ہر بلاک کو چلانے کے لیے اس پر "پلے" پر کلک کرنے کی ضرورت ہوگی، اگلے کو چلانے سے پہلے ہر بلاک کے مکمل ہونے کا انتظار کریں۔
جب کہ ہم تمام خصوصیات کے بارے میں تفصیلی ہدایات کے ذریعے قدم نہیں اٹھا رہے ہیں، صرف یہ جان لیں کہ سرخ متن صارف قابل ترمیم ہے، جیسا کہ تجویز کردہ متن جسے آپ چاہتے ہیں کہ ماڈل بولے۔ تقریباً سات بلاکس نیچے، آپ کے پاس ماڈل کو تربیت دینے کا اختیار ہوگا۔ آپ کو ماڈل کا نام دینے کی ضرورت ہوگی، پھر آڈیو فائلیں اپ لوڈ کریں۔ جب یہ مکمل ہو جائے تو، چوتھے بلاک میں نیا آڈیو ماڈل منتخب کریں، کوڈ چلائیں، پھر تیسرے بلاک میں متن کو ترتیب دیں۔ رن کہ کوڈ بلاک.
اگر سب کچھ منصوبہ بندی کے مطابق ہوتا ہے، تو آپ کے پاس اپنی نمونہ آواز کا ایک چھوٹا آڈیو آؤٹ پٹ ہوگا۔ کیا یہ کام کرتا ہے؟ ٹھیک ہے، میں نے اپنے ساتھی گورڈن مہ اُنگ کا ایک تیز اور گندا آواز کا ماڈل بنایا، جس کا کام ہمارے پر ظاہر ہوتا ہے۔ مکمل بیوقوف پوڈ کاسٹ نیز مختلف ویڈیوز۔ میں نے مختصر ٹکڑوں کے بجائے کئی منٹ کا نمونہ اپ لوڈ کیا، صرف یہ دیکھنے کے لیے کہ آیا یہ کام کرے گا۔
نتیجہ؟ ٹھیک ہے، یہ آواز زندگی پسند، لیکن گورڈن کی طرح بالکل نہیں۔ وہ یقینی طور پر فی الحال ڈیجیٹل نقالی سے محفوظ ہے۔ (یہ کسی بھی فاسٹ فوڈ چین کی توثیق نہیں ہے۔)
لیکن ایک موجودہ ماڈل جسے کچھوے کے مصنف نے اداکار ٹام ہینکس پر تربیت دی تھی بہت اچھا لگتا ہے۔ یہ یہاں ٹام ہینکس نہیں بول رہا ہے! ٹام نے بھی کیا۔ نوٹ مجھے نوکری کی پیشکش، لیکن یہ میرے کم از کم ایک دوست کو بے وقوف بنانے کے لیے کافی تھا۔
نتیجہ؟ یہ تھوڑا سا خوفناک ہے: جو کچھ ہم سنتے ہیں (اور جلد ہی دیکھتے ہیں) اس پر یقین کرنے کی عمر ختم ہو رہی ہے۔ یا یہ پہلے ہی موجود ہے۔
کوپن کوڈز
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو بلاک چین۔ Web3 Metaverse Intelligence. علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://www.pcworld.com/article/1473072/tom-hanks-did-not-offer-me-a-job-but-ai-sounds-like-it.html
- 1
- 2023
- 39
- a
- ہمارے بارے میں
- تک رسائی حاصل
- اکاؤنٹ
- اصل میں
- اپنانے
- AI
- یلیکس
- یلگوردمز
- تمام
- کی اجازت دیتا ہے
- پہلے ہی
- کے درمیان
- amp
- اور
- ایک اور
- جواب
- ایپلی کیشنز
- نقطہ نظر
- ارد گرد
- مضمون
- مصنوعی
- آڈیو
- مصنف
- دستیاب
- واپس
- برا
- کیونکہ
- اس سے پہلے
- شروع ہوا
- مومن
- بل
- بل کلنٹن
- بل گیٹس
- بایومیٹرک
- بٹ
- بلاک
- بلاکس
- براؤزر
- بٹن
- فون
- کہا جاتا ہے
- کارڈ
- قسم
- یقینی طور پر
- چین
- حروف
- چپ
- میں سے انتخاب کریں
- واضح
- کلپس
- بادل
- کوڈ
- ساتھی
- یکجا
- تبصروں
- تجارتی
- مکمل کرتا ہے
- اختتام
- کنٹرول
- کونے
- کورس
- ڈھکنے
- کریڈٹ
- CSS
- تاریخ
- دن
- تفصیل
- تفصیلی
- DID
- ڈیجیٹل
- نہیں کرتا
- نیچے
- ڈاؤن لوڈ، اتارنا
- درجن سے
- ڈرائیو
- ہر ایک
- ایڈیٹر
- یا تو
- یلون
- یلون کستوری
- ابھرتی ہوئی
- کافی
- درج
- خرابی
- بنیادی طور پر
- Ether (ETH)
- بھی
- سب کچھ
- مثال کے طور پر
- مثال کے طور پر
- بہترین
- عملدرآمد
- موجودہ
- جعلی
- واقف
- خصوصیات
- چند
- میدان
- فائل
- فائلوں
- توجہ مرکوز
- پر عمل کریں
- سابق
- پہلے
- چوتھے نمبر پر
- دوست
- سے
- مکمل
- مکمل طور پر
- گیٹس
- پیدا
- پیدا ہوتا ہے
- حاصل
- حاصل کرنے
- GitHub کے
- مقصد
- جاتا ہے
- جا
- اچھا
- گوگل
- GPU
- عظیم
- ہونے
- اونچائی
- ہور
- کس طرح
- تاہم
- HTML
- HTTPS
- انسانی
- سینکڑوں
- آئکن
- تصویر
- in
- انڈکس
- اشارہ کرتے ہیں
- ہدایات
- دلچسپ
- انٹرفیس
- دھمکی
- IT
- جنوری
- ایوب
- جوکر
- جان
- بڑے
- آخری
- آخری سال
- سیکھنے
- لائنوں
- لنکس
- تھوڑا
- رہتے ہیں
- دیکھنا
- بناتا ہے
- مینیجر
- نشان
- میٹرکس
- زیادہ سے زیادہ چوڑائی
- پیغامات
- مائیکروسافٹ
- شاید
- منٹ
- عکس
- ماڈل
- ماڈل
- کستوری
- نام
- ضرورت ہے
- نئی
- خبر
- اگلے
- نوٹ بک
- نوٹس
- پیش کرتے ہیں
- تجویز
- ایک
- کھول
- اوپن سورس
- اصلاح
- اختیار
- دیگر
- دیگر
- خود
- حصہ
- خاص طور پر
- پاس ورڈ
- گزشتہ
- PC
- لوگ
- کامل
- انسان
- ذاتی
- پچ
- منصوبہ بنایا
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- کھیلیں
- رابطہ بحال کرو
- پوسٹ
- پریمیم
- صدر
- خوبصورت
- پرائمری
- پروفائل
- فراہم کرتا ہے
- عوامی
- شائع
- ازگر
- معیار
- پڑھیں
- پڑھنا
- وصول
- حال ہی میں
- ریکارڈنگ
- ریڈ
- اٹ
- تعلقات
- جاری
- کی ضرورت ہے
- تحقیق
- محققین
- وسائل
- نتیجہ
- نتائج کی نمائش
- اضافہ
- ROBERT
- میں روبوٹ
- روبوٹس
- لپیٹنا
- رن
- چل رہا ہے
- محفوظ
- اسی
- محفوظ کریں
- منظر
- سیکنڈ
- سینئر
- SEO
- سروس
- سروسز
- سات
- مشترکہ
- مختصر
- ہونا چاہئے
- صرف
- بعد
- ایک
- شامیوں
- سائٹ
- سائٹس
- بیٹھنا
- سست
- چھوٹے
- So
- سافٹ ویئر کی
- کسی
- کچھ
- اسی طرح
- ماخذ
- بات
- اسپیکر
- بات
- بولی
- مخصوص
- تقریر
- شروع کریں
- شروع
- مرحلہ
- ذخیرہ
- خبریں
- اس طرح
- ٹیبل
- TAG
- لے لو
- ٹیکنالوجی
- ۔
- ان
- بات
- تھرڈ
- کے ذریعے
- وقت
- عنوان
- کرنے کے لئے
- بھی
- ٹرین
- تربیت یافتہ
- ٹریننگ
- ٹرن
- ٹویٹر
- اپ لوڈ کردہ
- اپ لوڈ کرنا
- URL
- رکن کا
- صارفین
- کی افادیت
- مختلف
- ورژن
- کی طرف سے
- ویڈیوز
- مجازی
- وائس
- آوازیں
- W
- انتظار کر رہا ہے
- چاہتے تھے
- انتباہ
- کیا
- جس
- جبکہ
- ڈبلیو
- گے
- کے اندر
- لفظ
- کام
- کام کرتا ہے
- گا
- لکھا
- سال
- اور
- یو ٹیوب پر
- زیفیرنیٹ