دلچسپ AI کارکردگی: چھوٹے ماڈلز کو ملانا بڑے ہم منصبوں کو پیچھے چھوڑ دیتا ہے

دلچسپ AI کارکردگی: چھوٹے ماڈلز کو ملانا بڑے ہم منصبوں کو پیچھے چھوڑ دیتا ہے

ماخذ نوڈ: 3069830

In recent years, the field of conversational AI has been significantly influenced by models like ChatGPT, characterized by their expansive parameter sizes. However, this approach comes with substantial demands on computational resources and memory. A study now introduces a novel concept: blending multiple smaller AI models to achieve or surpass the performance of larger models. This approach, termed “Blending,” ضم multiple chat AIs, offering an effective solution to the computational challenges of large models.

چائی ریسرچ پلیٹ فارم پر ایک بڑے صارف کی بنیاد کے ساتھ تیس دنوں کے دوران کی گئی یہ تحقیق، یہ ظاہر کرتی ہے کہ مخصوص چھوٹے ماڈلز کو ملانا ممکنہ طور پر بہت بڑے ماڈلز، جیسے کہ ChatGPT کی صلاحیتوں سے بہتر کارکردگی کا مظاہرہ کر سکتا ہے۔ مثال کے طور پر، 6B/13B پیرامیٹرز کے ساتھ صرف تین ماڈلز کو ضم کرنا 175B+ پیرامیٹرز کے ساتھ ChatGPT جیسے کافی بڑے ماڈلز کی کارکردگی کے میٹرکس کا مقابلہ یا اس سے بھی آگے نکل سکتا ہے۔

The increasing reliance on pre-trained large language models (LLMs) for diverse applications, particularly in chat AI, has led to a surge in the development of models with massive numbers of parameters. However, these large models require specialized infrastructure and have significant inference overheads, limiting their accessibility. The Blended approach, on the other hand, offers a more efficient alternative without compromising on conversational quality.

ملاوٹ شدہ AI کی تاثیر اس کے صارف کی مصروفیت اور برقرار رکھنے کی شرحوں میں واضح ہے۔ CHAI پلیٹ فارم پر بڑے پیمانے پر A/B ٹیسٹوں کے دوران، تین 6-13B پیرامیٹر LLMs پر مشتمل ملاوٹ شدہ جوڑ، OpenAI کے 175B+ پیرامیٹر ChatGPT کا مقابلہ کرتے ہوئے، نمایاں طور پر زیادہ صارف برقرار رکھنے اور مشغولیت حاصل کرتے ہوئے۔ اس سے ظاہر ہوتا ہے کہ صارفین نے Blended chat AIs کو زیادہ پرکشش، دل لگی اور مفید پایا، جب کہ بڑے ماڈلز کی صرف تخمینہ لاگت اور میموری اوور ہیڈ کی ضرورت ہوتی ہے۔

مطالعہ کے طریقہ کار میں Bayesian شماریاتی اصولوں کی بنیاد پر جوڑنا شامل ہے، جہاں کسی خاص ردعمل کے امکان کو ایک معمولی توقع کے طور پر تصور کیا جاتا ہے۔ ملاوٹ شدہ تصادفی طور پر چیٹ AI کا انتخاب کرتا ہے جو موجودہ ردعمل پیدا کرتا ہے، جس سے مختلف چیٹ AIs کو آؤٹ پٹ پر واضح طور پر اثر انداز ہونے کی اجازت ملتی ہے۔ اس کے نتیجے میں انفرادی چیٹ کی AI طاقتوں کی آمیزش ہوتی ہے، جس سے زیادہ دلکش اور متنوع ردعمل سامنے آتے ہیں۔

2024 کے لیے AI اور مشین لرننگ کے رجحانات میں پیش رفت زیادہ عملی، موثر، اور حسب ضرورت AI ماڈلز کی طرف بڑھنے پر زور دیتی ہے۔ جیسا کہ AI کاروباری کارروائیوں میں مزید مربوط ہو جاتا ہے، ایسے ماڈلز کی مانگ بڑھتی جا رہی ہے جو مخصوص ضروریات کو پورا کرتے ہیں، بہتر رازداری اور سیکیورٹی کی پیشکش کرتے ہیں۔ یہ تبدیلی بلینڈڈ اپروچ کے بنیادی اصولوں کے ساتھ ہم آہنگ ہے، جو کارکردگی، لاگت کی تاثیر، اور موافقت پر زور دیتا ہے۔

آخر میں، ملاوٹ شدہ طریقہ AI کی ترقی میں ایک اہم پیش رفت کی نمائندگی کرتا ہے۔ متعدد چھوٹے ماڈلز کو یکجا کرکے، یہ ایک موثر، سرمایہ کاری مؤثر حل پیش کرتا ہے جو برقرار رکھتا ہے، اور بعض صورتوں میں، بڑے، زیادہ وسائل والے ماڈلز کے مقابلے میں صارف کی مصروفیت اور برقراری کو بڑھاتا ہے۔ یہ نقطہ نظر نہ صرف بڑے پیمانے پر AIs کی عملی حدود کو دور کرتا ہے بلکہ مختلف شعبوں میں AI ایپلی کیشنز کے لیے نئے امکانات بھی کھولتا ہے۔

تصویری ماخذ: شٹر اسٹاک

ٹائم اسٹیمپ:

سے زیادہ بلاکچین نیوز