جنریٹو AI ان ویڈیوز کو دوبارہ تشکیل دیتا ہے جو لوگ اپنی دماغی سرگرمی کو پڑھ کر دیکھ رہے ہیں۔

جنریٹو AI ان ویڈیوز کو دوبارہ تشکیل دیتا ہے جو لوگ اپنی دماغی سرگرمی کو پڑھ کر دیکھ رہے ہیں۔

ماخذ نوڈ: 2679952

ابلیمشینوں کی ty ہمارے دماغ کو پڑھیں حالیہ برسوں میں مسلسل ترقی کر رہا ہے. اب، محققین نے AI ویڈیو جنریشن ٹیکنالوجی کا استعمال کرتے ہوئے ہمیں دماغ کی آنکھ میں کھڑکی فراہم کی ہے۔

دماغی اشاروں کی تشریح کرنے کی کوششوں کے پیچھے اصل محرک یہ امید ہے کہ ایک دن ہم کوما میں یا مختلف قسم کے فالج کے شکار لوگوں کے لیے رابطے کی نئی کھڑکیاں پیش کرنے کے قابل ہو جائیں گے۔ لیکن یہ امیدیں بھی ہیں کہ ٹیکنالوجی انسانوں اور مشینوں کے درمیان زیادہ بدیہی انٹرفیس بنا سکتی ہے جس میں صحت مند لوگوں کے لیے بھی ایپلی کیشنز ہو سکتی ہیں۔

اب تک، زیادہ تر تحقیق نے اندرونی یکجہتی کو دوبارہ تخلیق کرنے کی کوششوں پر توجہ مرکوز کی ہے۔s مریضوں کی، AI نظام کا استعمال کرتے ہوئے باہر لینے کے لئے وہ کیا الفاظ سوچ رہے ہیں. سب سے زیادہ امید افزا نتائج ناگوار دماغی امپلانٹس سے بھی آئے ہیں جو زیادہ تر لوگوں کے لیے عملی نقطہ نظر ہونے کا امکان نہیں ہے۔

اب اگرچہ، سنگاپور کی نیشنل یونیورسٹی اور ہانگ کانگ کی چائنیز یونیورسٹی کے محققین نے دکھایا ہے کہ وہ غیر حملہ آور دماغی اسکینوں اور AI امیج جنریشن ٹیکنالوجی کو ملا کر ویڈیو کے مختصر ٹکڑوں کو تخلیق کر سکتے ہیں جو غیر معمولی طور پر ان کلپس سے ملتے جلتے ہیں جنہیں مضامین دیکھ رہے تھے۔ جب ان کے دماغ کا ڈیٹا اکٹھا کیا گیا۔

کام اسی مصنفین کی تحقیق کی توسیع ہے۔ پچھلے سال کے آخر میں شائع ہوا۔، جہاں انہوں نے دکھایا کہ وہ ساکن تصاویر تیار کر سکتے ہیں جو تصویروں کے مضامین سے تقریباً مماثل ہیں۔ یہ ایف ایم آر آئی برین سکینرز کا استعمال کرتے ہوئے جمع کیے گئے ڈیٹا کی بڑی مقدار پر ایک ماڈل کی پہلی تربیت کے ذریعے حاصل کیا گیا۔ اس ماڈل کو پھر تصویریں بنانے کے لیے اوپن سورس امیج جنریشن AI Stable Diffusion کے ساتھ ملایا گیا۔

ایک نیا کاغذ میں پر شائع ہوا پری پرنٹ سرور arxiv, مصنفین اسی طرح کا نقطہ نظر اختیار کرتے ہیں، لیکن اس کو اپناتے ہیں تاکہ نظام دماغی ڈیٹا کی اسٹریمز کی تشریح کر سکے اور انہیں اسٹیلز کے بجائے ویڈیوز میں تبدیل کر سکے۔ سب سے پہلے، انہوں نے ایک ماڈل کو بڑی مقدار میں ایف ایم آر آئی پر تربیت دی تاکہ وہ ان دماغی اسکینوں کی عمومی خصوصیات کو جان سکے۔ اس کے بعد اس میں اضافہ کیا گیا تاکہ یہ انفرادی کی بجائے fMRI اسکینوں کے یکے بعد دیگرے پراسیس کرسکے، اور پھر fMRI اسکینوں کے امتزاج پر دوبارہ تربیت دی گئی، ویڈیو کے ٹکڑوں نے جو دماغ کی سرگرمی اور متن کی تفصیل کو ظاہر کیا۔

علیحدہ طور پر، محققین نے پہلے سے تربیت یافتہ اسٹیبل ڈفیوژن ماڈل کو ساکن تصاویر کے بجائے ویڈیو بنانے کے لیے ڈھال لیا۔ اس کے بعد اسے دوبارہ انہی ویڈیوز اور متن کی وضاحتوں پر تربیت دی گئی جس پر پہلے ماڈل کو تربیت دی گئی تھی۔ آخر میں، دونوں ماڈلز کو fMRI اسکینز اور ان سے منسلک ویڈیوز پر ایک ساتھ ملایا گیا اور ٹھیک بنایا گیا۔

اس کے نتیجے میں آنے والا نظام تازہ ایف ایم آر آئی اسکین لینے کے قابل تھا جو اس نے پہلے نہیں دیکھا تھا اور ایسی ویڈیوز تیار کیں جو بڑے پیمانے پر انسانی مضامین کے کلپس سے ملتی جلتی تھیں۔d اس وقت دیکھ رہا تھا. ایک پرفیکٹ میچ سے دور ہونے کے باوجود، AI کا آؤٹ پٹ عام طور پر اصل ویڈیو کے کافی قریب تھا، درست طریقے سے ہجوم کے مناظر یا گھوڑوں کے ریوڑ کو دوبارہ بناتا تھا اور اکثر رنگ پیلیٹ سے ملتا تھا۔

اپنے نظام کا جائزہ لینے کے لیے، محققین نے ایک ویڈیو درجہ بندی کا استعمال کیا جو اس بات کا اندازہ لگانے کے لیے ڈیزائن کیا گیا تھا کہ ماڈل نے منظر کے الفاظ کو کتنی اچھی طرح سے سمجھا ہے — مثال کے طور پر، آیا اس نے یہ محسوس کیا تھا کہ یہ ویڈیو ایکویریم میں مچھلی کے تیرنے کی ہے یا کسی خاندان کے راستے پر چل رہی ہے۔ یہاں تک کہ اگر امیجری قدرے مختلف تھی۔ ان کے ماڈل نے 85 فیصد اسکور کیا، جو کہ جدید ترین ماڈل کے مقابلے میں 45 فیصد بہتری ہے۔

اگرچہ اے آئی کی تیار کردہ ویڈیوز اب بھی ناقص ہیں، مصنفین کا کہنا ہے کہ تحقیق کی اس لائن میں بالآخر بنیادی نیورو سائنس اور مستقبل دونوں میں درخواستیں ہوسکتی ہیں۔ دماغ کی مشین انٹرفیس. تاہم، وہ ٹیکنالوجی کے ممکنہ نشیب و فراز کو بھی تسلیم کرتے ہیں۔ وہ لکھتے ہیں، "کسی کے حیاتیاتی ڈیٹا کی رازداری کو یقینی بنانے اور اس ٹیکنالوجی کے کسی بھی بدنیتی پر مبنی استعمال سے بچنے کے لیے حکومتی ضوابط اور تحقیقی برادریوں کی کوششوں کی ضرورت ہے۔"

یہ ممکنہ طور پر ان خدشات کی طرف اشارہ ہے کہ AI دماغ سکیننگ ٹیکنالوجی کا امتزاج لوگوں کے لیے ان کی رضامندی کے بغیر مداخلت کے ساتھ دوسرے کے خیالات کو ریکارڈ کرنا ممکن بنا سکتا ہے۔ Aپریشانیاں تھیں۔ بھی اس سال کے شروع میں اس وقت آواز اٹھائی جب محققین نے بنیادی طور پر کسی نہ کسی طرح پیدا کرنے کے لئے اسی طرح کا طریقہ استعمال کیا۔ لوگوں کے سروں کے اندر آواز کی نقل، اگرچہ ماہرین نے نشاندہی کی ہے کہ ایسا ہوگا۔ ناقابل عمل اگر ناممکن نہیں۔ مستقبل کے لئے

لیکن چاہے آپ اسے اپنی پرائیویسی پر ایک خوفناک حملے کے طور پر دیکھیں یا ٹیکنالوجی کے ساتھ انٹرفیس کرنے کے ایک دلچسپ نئے طریقے کے طور پر، ایسا لگتا ہے کہ مشینی ذہن کے قارئین حقیقت کے قریب پہنچ رہے ہیں۔

تصویری کریڈٹ: کلاڈیا ڈیوالڈ سے Pixabay

ٹائم اسٹیمپ:

سے زیادہ یکسانیت مرکز