علی بابا نے ایسے AI ماڈلز کا آغاز کیا جو تصاویر کو سمجھتے ہیں اور زیادہ پیچیدہ گفتگو کرتے ہیں۔

علی بابا نے ایسے AI ماڈلز کا آغاز کیا جو تصاویر کو سمجھتے ہیں اور زیادہ پیچیدہ گفتگو کرتے ہیں۔

ماخذ نوڈ: 2849026

مصنوعی ذہانت (AI) کی جگہ گرم ہو رہی ہے۔ ابھی کل ہی، جنوبی کوریا کے Naver نے HyperClova X کے اجراء کا اعلان کیا۔ChatGPT کے ساتھ مقابلہ کرنے کے لیے ایک نئی جنریٹو AI سروس۔ اب، چین کی انٹرنیٹ کمپنی دو اوپن سورس AI ماڈلز کی نقاب کشائی کر رہی ہے جو تصاویر کو سمجھ سکتے ہیں اور زیادہ پیچیدہ گفتگو کر سکتے ہیں۔

جمعہ کے روز، علی بابا نے نئے AI ماڈلز کی نقاب کشائی کی جو ان کی سابقہ ​​پیشکشوں کے مقابلے میں تصاویر کو سمجھنے اور زیادہ پیچیدہ گفتگو میں مشغول ہونے کے لیے بنائے گئے ہیں۔ یہ ریلیز تکنیکی قیادت کے لیے شدید عالمی مسابقت کے وقت سامنے آئی ہے۔

چینی ٹیک پاور ہاؤس نے کہا کہ ان کے دو نئے ماڈلز، جنہیں Qwen-VL اور Qwen-VL-Chat کہا جاتا ہے، کو اوپن سورس ٹولز کے طور پر دستیاب کرایا جائے گا، مطلب یہ ہے کہ دنیا بھر کے محققین، ماہرین تعلیم اور کاروباری ادارے ان ماڈلز کو اپنی ترقی کے لیے استعمال کر سکتے ہیں۔ اپنے AI ایپلی کیشنز کو ان کے انفرادی نظام کی تربیت کی ضرورت کے بغیر۔ یہ طریقہ نہ صرف وقت بچاتا ہے بلکہ اخراجات کو بھی نمایاں طور پر کم کرتا ہے۔

یہ خبر علی بابا کے Tongyi Wanxiang کو لانچ کرنے کے صرف ایک ماہ بعد سامنے آئی ہے، ایک AI امیج جنریشن ٹول جو OpenAI کے DALL-E اور Midjourney کا مقابلہ کرتا ہے۔ Tongyi Wanxiang، جو علی بابا کے کلاؤڈ ڈویژن کے ذریعے شروع کیا گیا ہے، صارفین کو چینی یا انگریزی میں متن کے اشارے داخل کرنے کی اجازت دیتا ہے، اور AI ٹول مختلف طرزوں، جیسے کہ خاکے یا 3D کارٹون میں متعلقہ تصاویر تیار کرتا ہے۔ فی الحال، یہ ٹول خصوصی طور پر چین میں انٹرپرائز صارفین کے لیے بیٹا ٹیسٹنگ کے لیے دستیاب ہے۔

دو نئے AI زبان کے ماڈلز بھی کمپنی کے کلاؤڈ یونٹ علی بابا کلاؤڈ نے تیار کیے ہیں۔ کے مطابق کی رپورٹ، ٹیک دیو نے کہا کہ Qwen-VL کو اس کے 7-بلین پیرامیٹر ماڈل، Tongyi Qianwen کے جدید ارتقاء کے لیے ڈیزائن کیا گیا تھا۔ یہ متحرک ماڈل تصاویر اور متن کے اشارے دونوں کو آسانی سے ہینڈل کرنے کی قابل ذکر صلاحیت کو ظاہر کرتا ہے۔ اس کی استعداد مختلف امیجز سے متعلق وسیع سوالوں کے مؤثر طریقے سے جواب دینے سے لے کر ان تصاویر کے لیے دلکش کیپشن بنانے تک پھیلی ہوئی ہے۔

علی بابا نے مزید کہا کہ Qwen-VL ایک ہی وقت میں متعدد کام انجام دے سکتا ہے۔ یہ نہ صرف مختلف تصاویر سے متعلق کھلے سوالات کا جواب دے سکتا ہے بلکہ یہ ان تصویروں کے لیے کیپشن بھی تیار کر سکتا ہے۔

لیکن شو کا اصل ستارہ Qwen-VL-Chat ہے۔ یہ AI زیادہ پیچیدہ تعاملات کو ہینڈل کرتا ہے، جیسے متعدد تصاویر کا موازنہ کرنا اور سوالات کے دوروں کو ہینڈل کرنا۔ یہ وہیں نہیں رک رہا ہے — علی بابا اس بات پر فخر کرتا ہے کہ وہ کہانیوں کو گھما سکتا ہے، صارف کی طرف سے جمع کرائی گئی تصاویر کی بنیاد پر تصاویر بنا سکتا ہے، اور یہاں تک کہ تصویروں میں پیش کردہ ریاضی کے مسائل کو حل کر سکتا ہے۔

ایک عمدہ مثال جو انہوں نے دی اس میں چینی زبان میں ہسپتال کا نشان شامل ہے۔ Qwen-VL-Chat اسے ڈی کوڈ کر سکتا ہے اور ہسپتال کے مختلف شعبے کہاں واقع ہیں اس کا پتہ دے سکتا ہے۔

دریں اثنا، موجودہ AI کا زیادہ تر "جینیئس" عام طور پر متن کے بارے میں رہا ہے۔ لیکن وقت بدل رہا ہے۔ Qwen-VL-Chat اور OpenAI کے ChatGPT کا تازہ ترین ورژن چیزوں کو ہلا کر رکھ رہے ہیں، متن کے ساتھ تصاویر کا اس طرح جواب دے رہے ہیں جو کافی متاثر کن ہے۔ یہ ایسا ہی ہے جیسے AI ایک نئی بصری زبان بولنا سیکھ رہا ہے!


ٹائم اسٹیمپ:

سے زیادہ ٹیک اسٹارٹپس