چیٹ جی پی ٹی روبوٹ میں سرایت کرتا ہے، انٹرنیٹ سے تہذیب کے خاتمے کا خدشہ ہے۔

چیٹ جی پی ٹی روبوٹ میں سرایت کرتا ہے، انٹرنیٹ سے تہذیب کے خاتمے کا خدشہ ہے۔

ماخذ نوڈ: 2611695

سعودی عرب کے پی ایچ ڈی کے طالب علموں کی ایک ٹیم نے اے آئی سے چلنے والا ایک نیا ٹول MiniGPT-4 تیار کیا ہے، جس میں اسی طرح کی خصوصیات ہیں۔ اوپن اے آئی چیٹ جی پی ٹی -4۔

چونکہ چیٹ جی پی ٹی نومبر میں ریلیز ہوئی اور عالمی سطح پر ہٹ بن گئی، ڈویلپرز نے نئے AI ٹولز کے ساتھ آنے میں کچھ بھی نہیں روکا جو یا تو مقبول چیٹ بوٹ کا مقابلہ کرتے ہیں یا اس کی تکمیل کرتے ہیں۔

ChatGPT ماڈل کا استعمال کرتے ہوئے تیار کیا گیا MiniGPT-4، صرف تازہ ترین مثال ہے۔

مزید پڑھئے: بل گیٹس: اے آئی چیٹ بوٹس بچوں کو 18 ماہ میں پڑھنا سکھا سکتے ہیں۔

کے مطابق مستقبل کے اوزار, MiniGPT-4 بہت سے کاموں کے قابل ہے بشمول تصویر کی تفصیل کی نسلیں اور ویب سائٹس کی تعمیر۔

"یہ ٹول تصویر کی تفصیلی وضاحت تیار کرنے، ہاتھ سے لکھے ہوئے مسودوں سے ویب سائٹس بنانے، دی گئی تصاویر سے متاثر ہو کر کہانیاں اور نظمیں لکھنے، تصاویر میں دکھائے گئے مسائل کا حل فراہم کرنے، اور صارفین کو کھانے کی تصاویر کی بنیاد پر کھانا پکانے کا طریقہ سکھانے کی صلاحیت رکھتا ہے،" مستقبل کا دعویٰ کرتا ہے۔ اوزار.

جب ChatGPT-4 جاری کیا گیا تھا، ماڈل کی ایک ویڈیو دکھائی گئی تھی جو اسکیچ امیج سے ویب سائٹ بنا رہی تھی۔ کی طرف سے ایک ٹویٹ کے مطابق بارسی، MiniGPT-4 اسی کارنامے کو دور کرنے کی صلاحیت رکھتا ہے۔ فرق صرف اتنا ہے کہ ChatGPT-4 فی الحال ہر کسی کے لیے دستیاب نہیں ہے، جبکہ MiniGPT-4 پہلے سے ہی جنگلی میں ہے۔

MiniGPT کو سمجھنا

کے مطابق Ghacks, MiniGPT-4 Vicuna نامی ایک ایڈوانسڈ LLM کو لینگویج ڈیکوڈر کے طور پر استعمال کرتا ہے، جو LLaMa پر بنایا گیا ہے اور GPT-90 کے ذریعے جانچے گئے ChatGPT کے معیار کا 4% حاصل کرنے کی اطلاع ہے۔

AI ماڈل نے بوٹسٹریپنگ لینگویج امیج پری ٹریننگ (BLIP-2) کے پہلے سے تربیت یافتہ جزو کا استعمال کیا ہے اور دیگر تمام وژن اور زبان کے اجزاء کو منجمد کر کے ویکونا لینگویج ماڈل کے ساتھ انکوڈ شدہ بصری خصوصیات کو سیدھ میں لانے کے لیے ایک واحد انجیکشن لیئر کا اضافہ کیا ہے۔

ڈیوڈ واٹسن کہتے ہیں کہ MiniGPT ہلکا پھلکا ہے اور اسے چیٹ بوٹس، ورچوئل اسسٹنٹس اور خودکار امیج کیپشننگ سسٹم جیسے حقیقی وقت کے حالات میں آسانی سے لاگو کیا جا سکتا ہے۔

وہ چند ممکنہ ایپلی کیشنز کی فہرست بھی دیتا ہے جو MiniGPT-4 کے لیے ایک اچھا استعمال ہو سکتی ہیں: تصویری کیپشننگ سسٹم بنانا جس کے لیے صرف ہلکے وسائل کی ضرورت ہوتی ہے۔ اور بصارت سے محروم افراد کے لیے آڈیو تفصیل کا استعمال کرتے ہوئے تصویر کی تفصیل، ایک ایسا طریقہ جس میں متن سے آڈیو سسٹم کی ضرورت ہوگی۔

جبکہ اوپنائی GPT-4 کی ملٹی موڈل صلاحیتوں کی تصدیق کی، انہوں نے ابھی تک اس کی امیج پروسیسنگ کی صلاحیتوں کو جاری کرنا ہے۔ MiniGPT-4 ایک زیادہ نفیس LLM کا استعمال کرتے ہوئے زبان کے ساتھ تصاویر پر کارروائی کرکے اس خلا کو پُر کرتا ہے۔

تحقیق میں مدد کے لیے ایک AI ٹول

ماہرین کا کہنا ہے کہ جدید ترین فاؤنڈیشنل لینگویج ماڈل کا استعمال کیا گیا ہے تاکہ محققین کو اس مخصوص AI سیگمنٹ میں اپنے کام کو آگے بڑھانے میں مدد فراہم کی جا سکے۔

یہ دیکھتے ہوئے کہ OpenAI نے GPT-4 کے فن تعمیر، ماڈل سائز، ہارڈ ویئر، تربیتی کمپیوٹ، ڈیٹاسیٹ کی تعمیر یا تربیت کے طریقہ کار کے بارے میں زیادہ معلومات ظاہر نہیں کی ہیں، MiniGPT-4 کی اوپن سورس نوعیت محققین کے لیے خاص طور پر قابل قدر ثابت ہو سکتی ہے۔

"تصاویر پر کارروائی کرنے کی MiniGPT کی صلاحیت محققین کو زبان اور بصارت کے ماڈلز کے درمیان تعلق کی چھان بین کے نئے مواقع فراہم کرتی ہے،" یانا کھارا نے کہا۔ تجزیات ودھایا.

"محققین کے ساتھ کام کرنے کے لیے ایک چھوٹا، زیادہ قابل رسائی ماڈل پیش کرکے، MiniGPT-4 AI ٹیکنالوجی میں جدت اور ترقی کو آگے بڑھا سکتا ہے۔

"مزید برآں، ماڈل کی اوپن سورس فاؤنڈیشن اس بات کو یقینی بناتی ہے کہ تحقیقی برادری اس شعبے میں مزید پیشرفت کے لیے اپنے نتائج کا اشتراک اور اشتراک کر سکتی ہے۔"

MiniGPT تصویر کیپشننگ کو ایک اور سطح پر لے جاتا ہے۔

بارسی، جس نے ایک دھاگہ ٹویٹ کیا جس میں بتایا گیا ہے کہ کس طرح MiniGPT-4 کو تصاویر کے ساتھ چیٹ کرنے کے لیے استعمال کیا جا سکتا ہے، اس میں درج ذیل میں سے کچھ معاملات شامل ہیں:

ٹوٹی ہوئی اشیاء کو ٹھیک کرنا

MiniGPT پلیٹ فارم پر ٹوٹی ہوئی چیز کی تصویر اپ لوڈ کرکے اور یہ پوچھنے سے کہ آپ تصویر کی صورت حال کو کیسے ٹھیک کر سکتے ہیں، چیٹ بوٹ تصویر کی صورت حال کی وضاحت کرے گا اور شناخت شدہ مسائل کو حل کرنے کے طریقے تجویز کرے گا۔

میں ٹویٹ MiniGPT آسانی سے مسئلہ کی شناخت کر سکتا ہے، ایک لیک ہونے والی واشنگ مشین، اس وجہ کی وضاحت کرتا ہے کہ لیک کیوں ہو سکتی ہے اور ان حلوں کی فہرست بھی فراہم کر سکتی ہے جو صارف آزما سکتا ہے۔

اشتہارات لکھنا

ایک اور میں بارسی سے ٹویٹ MiniGPT تھریڈ پر، اس نے ایک ایسا منظر نامہ شامل کیا جہاں MiniGPT کو صارف کے بنائے اور بیچنے والے مگ کی تصویر دی گئی۔ اس کے بعد صارف چیٹ بوٹ سے مگ کی مارکیٹنگ کے لیے ایک اشتہار لکھنے کو کہتا ہے، جو چیٹ بوٹ مناسب طریقے سے کرتا ہے۔

مختصر تعارف

بس ایک فلم کی تصویر اپ لوڈ کریں اور MiniGPT سے آپ کو ایک مختصر تعارف دینے کو کہیں۔ اس کے بعد یہ زیر بحث فلم کا ایک پیراگراف تعارف تیار کرے گا۔ جیسا کہ میں دیکھا گیا ہے۔ ٹویٹ MiniGPT چیٹ بوٹ "دی گاڈ فادر" کی تصویر کو پہچانتا ہے اور ہدایت کے مطابق فلم کا تعارف لکھتا ہے۔

ChatGPT کے شروع ہونے کے بعد سے مارکیٹ نے بے شمار نئے AI ٹولز تیار کیے ہیں۔ مشہور چیٹ بوٹ کے اور بھی متبادل موجود ہیں جن کے ساتھ مبینہ طور پر دوسروں نے اسے پیچھے چھوڑ دیا ہے، کم از کم نہیں۔ آٹو جی پی ٹی، جو اب بھی AI کمیونٹی میں لہریں بنا رہا ہے۔ اس شرح سے، یہ تقریباً ناگزیر معلوم ہوتا ہے کہ ہم عملی طور پر کسی بھی انسانی کام کے لیے AI دولت کی شرمندگی کا سامنا کریں گے۔

ٹائم اسٹیمپ:

سے زیادہ میٹا نیوز