Alibaba Launches AI Models That Understand Images And Have More Complex Conversations

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

مصنوعی ذہانت (AI) کی جگہ گرم ہو رہی ہے۔ ابھی کل ہی، جنوبی کوریا کے Naver نے HyperClova X کے اجراء کا اعلان کیا۔ChatGPT کے ساتھ مقابلہ کرنے کے لیے ایک نئی جنریٹو AI سروس۔ اب، چین کی انٹرنیٹ کمپنی دو اوپن سورس AI ماڈلز کی نقاب کشائی کر رہی ہے جو تصاویر کو سمجھ سکتے ہیں اور زیادہ پیچیدہ گفتگو کر سکتے ہیں۔

جمعہ کے روز، علی بابا نے نئے AI ماڈلز کی نقاب کشائی کی جو ان کی سابقہ پیشکشوں کے مقابلے میں تصاویر کو سمجھنے اور زیادہ پیچیدہ گفتگو میں مشغول ہونے کے لیے بنائے گئے ہیں۔ یہ ریلیز تکنیکی قیادت کے لیے شدید عالمی مسابقت کے وقت سامنے آئی ہے۔

چینی ٹیک پاور ہاؤس نے کہا کہ ان کے دو نئے ماڈلز، جنہیں Qwen-VL اور Qwen-VL-Chat کہا جاتا ہے، کو اوپن سورس ٹولز کے طور پر دستیاب کرایا جائے گا، مطلب یہ ہے کہ دنیا بھر کے محققین، ماہرین تعلیم اور کاروباری ادارے ان ماڈلز کو اپنی ترقی کے لیے استعمال کر سکتے ہیں۔ اپنے AI ایپلی کیشنز کو ان کے انفرادی نظام کی تربیت کی ضرورت کے بغیر۔ یہ طریقہ نہ صرف وقت بچاتا ہے بلکہ اخراجات کو بھی نمایاں طور پر کم کرتا ہے۔

یہ خبر علی بابا کے Tongyi Wanxiang کو لانچ کرنے کے صرف ایک ماہ بعد سامنے آئی ہے، ایک AI امیج جنریشن ٹول جو OpenAI کے DALL-E اور Midjourney کا مقابلہ کرتا ہے۔ Tongyi Wanxiang، جو علی بابا کے کلاؤڈ ڈویژن کے ذریعے شروع کیا گیا ہے، صارفین کو چینی یا انگریزی میں متن کے اشارے داخل کرنے کی اجازت دیتا ہے، اور AI ٹول مختلف طرزوں، جیسے کہ خاکے یا 3D کارٹون میں متعلقہ تصاویر تیار کرتا ہے۔ فی الحال، یہ ٹول خصوصی طور پر چین میں انٹرپرائز صارفین کے لیے بیٹا ٹیسٹنگ کے لیے دستیاب ہے۔

دو نئے AI زبان کے ماڈلز بھی کمپنی کے کلاؤڈ یونٹ علی بابا کلاؤڈ نے تیار کیے ہیں۔ کے مطابق کی رپورٹ، ٹیک دیو نے کہا کہ Qwen-VL کو اس کے 7-بلین پیرامیٹر ماڈل، Tongyi Qianwen کے جدید ارتقاء کے لیے ڈیزائن کیا گیا تھا۔ یہ متحرک ماڈل تصاویر اور متن کے اشارے دونوں کو آسانی سے ہینڈل کرنے کی قابل ذکر صلاحیت کو ظاہر کرتا ہے۔ اس کی استعداد مختلف امیجز سے متعلق وسیع سوالوں کے مؤثر طریقے سے جواب دینے سے لے کر ان تصاویر کے لیے دلکش کیپشن بنانے تک پھیلی ہوئی ہے۔

علی بابا نے مزید کہا کہ Qwen-VL ایک ہی وقت میں متعدد کام انجام دے سکتا ہے۔ یہ نہ صرف مختلف تصاویر سے متعلق کھلے سوالات کا جواب دے سکتا ہے بلکہ یہ ان تصویروں کے لیے کیپشن بھی تیار کر سکتا ہے۔

لیکن شو کا اصل ستارہ Qwen-VL-Chat ہے۔ یہ AI زیادہ پیچیدہ تعاملات کو ہینڈل کرتا ہے، جیسے متعدد تصاویر کا موازنہ کرنا اور سوالات کے دوروں کو ہینڈل کرنا۔ یہ وہیں نہیں رک رہا ہے — علی بابا اس بات پر فخر کرتا ہے کہ وہ کہانیوں کو گھما سکتا ہے، صارف کی طرف سے جمع کرائی گئی تصاویر کی بنیاد پر تصاویر بنا سکتا ہے، اور یہاں تک کہ تصویروں میں پیش کردہ ریاضی کے مسائل کو حل کر سکتا ہے۔

ایک عمدہ مثال جو انہوں نے دی اس میں چینی زبان میں ہسپتال کا نشان شامل ہے۔ Qwen-VL-Chat اسے ڈی کوڈ کر سکتا ہے اور ہسپتال کے مختلف شعبے کہاں واقع ہیں اس کا پتہ دے سکتا ہے۔

دریں اثنا، موجودہ AI کا زیادہ تر "جینیئس" عام طور پر متن کے بارے میں رہا ہے۔ لیکن وقت بدل رہا ہے۔ Qwen-VL-Chat اور OpenAI کے ChatGPT کا تازہ ترین ورژن چیزوں کو ہلا کر رکھ رہے ہیں، متن کے ساتھ تصاویر کا اس طرح جواب دے رہے ہیں جو کافی متاثر کن ہے۔ یہ ایسا ہی ہے جیسے AI ایک نئی بصری زبان بولنا سیکھ رہا ہے!

SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
پلیٹو ای ایس جی۔ آٹوموٹو / ای وی، کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
چارٹ پرائم۔ ChartPrime کے ساتھ اپنے ٹریڈنگ گیم کو بلند کریں۔ یہاں تک رسائی حاصل کریں۔
بلاک آفسیٹس۔ ماحولیاتی آفسیٹ ملکیت کو جدید بنانا۔ یہاں تک رسائی حاصل کریں۔
ماخذ: https://techstartups.com/2023/08/25/alibaba-launches-qwen-vl-and-qwen-vl-chat-ai-models-that-understand-images-and-have-more-complex-conversations/

ٹائم اسٹیمپ: اگست 25، 2023

ٹائم اسٹیمپ: جون 15، 2023

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

دنیا کا سب سے بڑا کرپٹو ایکسچینج Binance 2,000 نئے ملازمین کی خدمات حاصل کر رہا ہے یہاں تک کہ Coinbase نے اپنی افرادی قوت کا 18% نکال دیا ہے۔

موسمیاتی آغاز میک سن سیٹس سورج کو روکنے کے لیے زہریلے کیمیکلز کو فضا میں چھوڑتا ہے، سائنسدانوں کو خطرے کی گھنٹی

جنریٹو اے آئی آن لائن شاپنگ سے ملتا ہے: ایمیزون نے خریداروں کے سوالات کے جوابات دینے کے لیے اے آئی ٹول کی نقاب کشائی کی – TechStartups

مائیکروسافٹ کے AI چیٹ بوٹ کو چیلنج کرنے کے لیے گوگل نے PaLM 2 کی نقاب کشائی کی، جو اس کا سب سے طاقتور عام مقصد AI ہے۔

کاوا چین اب فائر بلاکس پر لائیو، ادارہ جاتی سرمایہ کاروں کے لیے Cosmos DeFi کھول رہا ہے

LoanDepot ہیک: امریکہ کا دوسرا سب سے بڑا نان بینک مارگیج قرض دہندہ سائبر حملے کا نشانہ بن گیا – TechStartups

Character.AI سب سے زیادہ تخلیقی AI اسٹارٹ اپ ہے جس کے بارے میں ہر کوئی بات کر رہا ہے۔ اپنے پہلے ہفتے میں 1.7M ڈاؤن لوڈز لاگ ان ہوئے۔

ہمارے متعلق

عمودی تلاش اور Ai

پلیٹ فارم

مربوط رہو

اکاؤنٹ