نئے اوپن اے آئی ایمبیڈنگ ماڈلز کیا پیش کرتے ہیں؟

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

مصنوعی ذہانت کا دائرہ نئے OpenAI ایمبیڈنگ ماڈلز کے ساتھ تیار ہوتا رہتا ہے۔ وہ اس بات کی دوبارہ وضاحت کرنے کے لیے تیار ہیں کہ ڈویلپرز قدرتی زبان کی پروسیسنگ تک کیسے پہنچتے ہیں۔ دو گراؤنڈ بریکنگ ماڈلز کو دریافت کرنے سے پہلے، ہر ایک کو AI ایپلی کیشنز کی صلاحیتوں کو بڑھانے کے لیے ڈیزائن کیا گیا ہے، یہاں کیا ہے سرایت مطلب:

OpenAI کی ٹیکسٹ ایمبیڈنگز ٹیکسٹ سٹرنگز کے درمیان ارتباط کا اندازہ لگانے کے لیے ایک میٹرک کے طور پر کام کرتی ہیں، مختلف ڈومینز میں ایپلی کیشنز تلاش کرنا، بشمول:

تلاش کریں: تلاش کے نتائج کی درستگی کو بڑھاتے ہوئے، کسی دیے گئے استفسار کے اسٹرنگ سے ان کی مطابقت کی بنیاد پر نتائج کی درجہ بندی کرنے کے لیے استعمال کیا جاتا ہے۔
کلسٹرنگ: متنی تاروں کو ان کی مماثلتوں کی بنیاد پر گروپ کرنے کے لیے استعمال کیا جاتا ہے، متعلقہ معلومات کی تنظیم میں سہولت فراہم کرنا۔
سفارشات: سفارشی نظاموں میں ان اشیاء کو تجویز کرنے کے لیے لاگو کیا جاتا ہے جو ان کے متن کے تاروں میں مشترکات کا اشتراک کرتے ہیں، تجاویز کی ذاتی نوعیت کو بڑھاتے ہیں۔
بے عیب شناخت: کم سے کم وابستگی کے ساتھ باہر جانے والوں کی شناخت کرنے کے لیے ملازم، فاسد نمونوں یا ڈیٹا پوائنٹس کا پتہ لگانے میں مدد کرتا ہے۔
تنوع کی پیمائش: ڈیٹاسیٹس یا ٹیکسٹ کارپورا کے اندر تنوع کی تشخیص کو فعال کرنے، مماثلت کی تقسیم کا تجزیہ کرنے کے لیے استعمال کیا جاتا ہے۔
کی درجہ بندی: درجہ بندی کے کاموں میں تعینات جہاں ٹیکسٹ سٹرنگز کو ان کے سب سے زیادہ ملتے جلتے لیبل کے مطابق درجہ بندی کیا جاتا ہے، مشین لرننگ ایپلی کیشنز میں لیبلنگ کے عمل کو ہموار کرتے ہوئے۔

اب آپ نئے OpenAI ایمبیڈنگ ماڈلز کو دریافت کرنے کے لیے تیار ہیں!

نئے اوپن اے آئی ایمبیڈنگ ماڈل آچکے ہیں۔

نئے OpenAI ایمبیڈنگ ماڈلز کا تعارف قدرتی لینگویج پروسیسنگ میں ایک اہم چھلانگ کی نشاندہی کرتا ہے، جس سے ڈویلپرز کو متنی مواد کی بہتر نمائندگی اور سمجھنے کے قابل بناتا ہے۔ آئیے ان جدید ماڈلز کی تفصیلات پر غور کریں: ٹیکسٹ ایمبیڈنگ-3-چھوٹا اور ٹیکسٹ ایمبیڈنگ-3-بڑا.

ٹیکسٹ ایمبیڈنگ-3-چھوٹا

یہ کمپیکٹ لیکن طاقتور ماڈل اپنے پیشرو، ٹیکسٹ-ایمبیڈنگ-اڈا-002 کے مقابلے میں قابل ذکر کارکردگی کو فروغ دیتا ہے۔ ملٹی لینگویج ریٹریول بینچ مارک (MIRACL) پر، اوسط سکور 31.4% سے بڑھ کر ایک متاثر کن 44.0% ہو گیا ہے۔ اسی طرح، انگلش ٹاسک بینچ مارک (MTEB) پر، اوسط سکور میں 61.0% سے 62.3% تک قابل ستائش اضافہ دیکھنے میں آیا ہے۔ تاہم، جو چیز text-embedding-3-small کو الگ کرتی ہے وہ نہ صرف اس کی بہتر کارکردگی ہے بلکہ اس کی استطاعت بھی ہے۔

ایول بینچ مارک	ada v2	ٹیکسٹ ایمبیڈنگ-3-چھوٹا	ٹیکسٹ ایمبیڈنگ-3-بڑا
MIRACL اوسط	31.4	44.0	54.9
MTEB اوسط	61.0	62.3	64.6

OpenAI نے قیمتوں کو نمایاں طور پر کم کر دیا ہے، جس سے ٹیکسٹ-ایمبیڈنگ-ada-5 کے مقابلے میں یہ 002 گنا زیادہ لاگت سے موثر ہے، فی 1k ٹوکن کی قیمت $0.0001 سے $0.00002 تک کم ہو گئی ہے۔ یہ ٹیکسٹ ایمبیڈنگ-3-چھوٹا نہ صرف ایک زیادہ موثر انتخاب بناتا ہے بلکہ ڈویلپرز کے لیے زیادہ قابل رسائی بھی ہے۔

ٹیکسٹ ایمبیڈنگ-3-بڑا

ایمبیڈنگ ماڈلز کی اگلی نسل کی نمائندگی کرتے ہوئے، ٹیکسٹ-ایمبیڈنگ-3-large 3072 ڈائمینشنز کے ساتھ ایمبیڈنگ کو سپورٹ کرتے ہوئے ابعاد میں خاطر خواہ اضافہ کرتا ہے۔ یہ بڑا ماڈل متنی مواد کی زیادہ تفصیلی اور باریک بینی کی نمائندگی کرتا ہے۔ کارکردگی کے لحاظ سے، ٹیکسٹ ایمبیڈنگ-3-large تمام بینچ مارکس میں اپنے پیشرو کو پیچھے چھوڑ دیتا ہے۔ MIRACL پر، اوسط سکور 31.4% سے بڑھ کر ایک متاثر کن 54.9% ہو گیا ہے، جو کثیر زبانوں کی بازیافت میں اس کی صلاحیت کو نمایاں کرتا ہے۔

	ada v2	ٹیکسٹ ایمبیڈنگ-3-چھوٹا		ٹیکسٹ ایمبیڈنگ-3-بڑا
سرایت کرنے کا سائز	1536	512	1536	256	1024	3072
اوسط MTEB سکور	61.0	61.6	62.3	62.0	64.1	64.6

اسی طرح، MTEB پر، اوسط سکور 61.0% سے بڑھ کر 64.6% ہو گیا ہے، جو انگریزی کے کاموں میں اپنی برتری کو ظاہر کرتا ہے۔ $0.00013 فی 1k ٹوکن کی قیمت پر، ٹیکسٹ ایمبیڈنگ-3-large کارکردگی کی عمدہ اور لاگت کی تاثیر کے درمیان توازن قائم کرتا ہے، جو ڈیولپرز کو اعلی جہتی سرایت کا مطالبہ کرنے والی ایپلی کیشنز کے لیے ایک مضبوط حل پیش کرتا ہے۔

سے ملو Google Lumiere AI، بارڈ کا ویڈیو بنانے والا کزن

ایمبیڈنگ کو مختصر کرنے کے لیے مقامی حمایت

ڈویلپرز کی متنوع ضروریات کو تسلیم کرتے ہوئے، OpenAI نے ایمبیڈنگ کو مختصر کرنے کے لیے مقامی مدد متعارف کرائی ہے۔ یہ جدید تکنیک ڈویلپرز کو ڈائمینشن API پیرامیٹر کو ایڈجسٹ کرکے ایمبیڈنگ سائز کو اپنی مرضی کے مطابق کرنے کی اجازت دیتی ہے۔ ایسا کرنے سے، ڈویلپر ایمبیڈنگ کی بنیادی خصوصیات سے سمجھوتہ کیے بغیر چھوٹے ویکٹر کے سائز کے لیے کچھ کارکردگی کو ٹریڈ آف کر سکتے ہیں۔ یہ لچک خاص طور پر ان منظرناموں میں قابل قدر ہے جہاں سسٹمز صرف ایک مخصوص سائز تک سرایت کرنے کی حمایت کرتے ہیں، جو ڈویلپرز کو استعمال کے مختلف منظرناموں کے لیے ایک ورسٹائل ٹول فراہم کرتے ہیں۔

خلاصہ یہ کہ اوپن اے آئی کے نئے ایمبیڈنگ ماڈلز کارکردگی، استطاعت اور کارکردگی میں ایک اہم قدم کی نمائندگی کرتے ہیں۔ چاہے ڈویلپرز ٹیکسٹ-ایمبیڈنگ-3-چھوٹے کی کمپیکٹ لیکن موثر نمائندگی کا انتخاب کریں یا ٹیکسٹ-ایمبیڈنگ-3-بڑے کی زیادہ وسیع اور تفصیلی ایمبیڈنگز کا انتخاب کریں، یہ ماڈلز ڈویلپرز کو ورسٹائل ٹولز کے ساتھ بااختیار بناتے ہیں تاکہ ان کے AI میں متنی ڈیٹا سے گہری بصیرت حاصل کی جا سکے۔ ایپلی کیشنز

نئے OpenAI ایمبیڈنگ ماڈلز کے بارے میں مزید تفصیلی معلومات کے لیے، کلک کریں۔ یہاں اور باضابطہ اعلان حاصل کریں۔

نمایاں تصویری کریڈٹ: Levart_Photographer/Unsplash

SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
ماخذ: https://dataconomy.com/2024/01/26/new-openai-embedding-models/

ٹائم اسٹیمپ: جنوری۳۱، ۲۰۱۹

ٹائم اسٹیمپ: فروری 1، 2024

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

ایمیزون ٹائٹن امیج جنریٹر گیم کو تبدیل کرنے کے لیے یہاں ہے۔

ٹرمینیٹر ڈائریکٹر اے آئی کو اسکائی نیٹ بننے دینے سے ڈرتا ہے۔

ایف ٹی سی نے ایمیزون پر مقدمہ چلایا اور کمپنی ایمیزون کے مقدمے میں پراعتماد ہے۔

جانچ پڑتال کے تحت NFT ہائپ کی ٹرین کا تباہی۔

فٹ بال آسٹریلیا ڈیٹا کی خلاف ورزی - ایک بدقسمتی سے اپنا مقصد

ہمارے متعلق

عمودی تلاش اور Ai

پلیٹ فارم

مربوط رہو

اکاؤنٹ