نئے OpenAI ایمبیڈنگ ماڈل کیا پیش کرتے ہیں؟

نئے OpenAI ایمبیڈنگ ماڈل کیا پیش کرتے ہیں؟

ماخذ نوڈ: 3084949

مصنوعی ذہانت کا دائرہ نئے OpenAI ایمبیڈنگ ماڈلز کے ساتھ تیار ہوتا رہتا ہے۔ وہ اس بات کی دوبارہ وضاحت کرنے کے لیے تیار ہیں کہ ڈویلپرز قدرتی زبان کی پروسیسنگ تک کیسے پہنچتے ہیں۔ دو گراؤنڈ بریکنگ ماڈلز کو دریافت کرنے سے پہلے، ہر ایک کو AI ایپلی کیشنز کی صلاحیتوں کو بڑھانے کے لیے ڈیزائن کیا گیا ہے، یہاں کیا ہے سرایت مطلب:

OpenAI کی ٹیکسٹ ایمبیڈنگز ٹیکسٹ سٹرنگز کے درمیان ارتباط کا اندازہ لگانے کے لیے ایک میٹرک کے طور پر کام کرتی ہیں، مختلف ڈومینز میں ایپلی کیشنز تلاش کرنا، بشمول:

  • تلاش کریں: تلاش کے نتائج کی درستگی کو بڑھاتے ہوئے، کسی دیے گئے استفسار کے اسٹرنگ سے ان کی مطابقت کی بنیاد پر نتائج کی درجہ بندی کرنے کے لیے استعمال کیا جاتا ہے۔
  • کلسٹرنگ: متنی تاروں کو ان کی مماثلتوں کی بنیاد پر گروپ کرنے کے لیے استعمال کیا جاتا ہے، متعلقہ معلومات کی تنظیم میں سہولت فراہم کرنا۔
  • سفارشات: سفارشی نظاموں میں ان اشیاء کو تجویز کرنے کے لیے لاگو کیا جاتا ہے جو ان کے متن کے تاروں میں مشترکات کا اشتراک کرتے ہیں، تجاویز کی ذاتی نوعیت کو بڑھاتے ہیں۔
  • بے عیب شناخت: کم سے کم وابستگی کے ساتھ باہر جانے والوں کی شناخت کرنے کے لیے ملازم، فاسد نمونوں یا ڈیٹا پوائنٹس کا پتہ لگانے میں مدد کرتا ہے۔
  • تنوع کی پیمائش: ڈیٹاسیٹس یا ٹیکسٹ کارپورا کے اندر تنوع کی تشخیص کو فعال کرنے، مماثلت کی تقسیم کا تجزیہ کرنے کے لیے استعمال کیا جاتا ہے۔
  • کی درجہ بندی: درجہ بندی کے کاموں میں تعینات جہاں ٹیکسٹ سٹرنگز کو ان کے سب سے زیادہ ملتے جلتے لیبل کے مطابق درجہ بندی کیا جاتا ہے، مشین لرننگ ایپلی کیشنز میں لیبلنگ کے عمل کو ہموار کرتے ہوئے۔

اب آپ نئے OpenAI ایمبیڈنگ ماڈلز کو دریافت کرنے کے لیے تیار ہیں!

نئے اوپن اے آئی ایمبیڈنگ ماڈل آچکے ہیں۔

نئے OpenAI ایمبیڈنگ ماڈلز کا تعارف قدرتی لینگویج پروسیسنگ میں ایک اہم چھلانگ کی نشاندہی کرتا ہے، جس سے ڈویلپرز کو متنی مواد کی بہتر نمائندگی اور سمجھنے کے قابل بناتا ہے۔ آئیے ان جدید ماڈلز کی تفصیلات پر غور کریں: ٹیکسٹ ایمبیڈنگ-3-چھوٹا اور ٹیکسٹ ایمبیڈنگ-3-بڑا.

نئے OpenAI ایمبیڈنگ ماڈلز دریافت کریں – ٹیکسٹ-ایمبیڈنگ-3-چھوٹا اور ٹیکسٹ-ایمبیڈنگ-3-بڑا- بہتر سستی، کارکردگی، اور بہت کچھ!
نئے اوپن اے آئی ایمبیڈنگ ماڈلز، ٹیکسٹ ایمبیڈنگ-3-چھوٹے اور ٹیکسٹ ایمبیڈنگ-3-بڑے، قدرتی لینگویج پروسیسنگ میں نمایاں پیش رفت کو ظاہر کرتے ہیں، مختلف ڈویلپر کی ضروریات کو پورا کرتے ہیں (تصویری کریڈٹ)

ٹیکسٹ ایمبیڈنگ-3-چھوٹا

یہ کمپیکٹ لیکن طاقتور ماڈل اپنے پیشرو، ٹیکسٹ-ایمبیڈنگ-اڈا-002 کے مقابلے میں قابل ذکر کارکردگی کو فروغ دیتا ہے۔ ملٹی لینگویج ریٹریول بینچ مارک (MIRACL) پر، اوسط سکور 31.4% سے بڑھ کر ایک متاثر کن 44.0% ہو گیا ہے۔ اسی طرح، انگلش ٹاسک بینچ مارک (MTEB) پر، اوسط سکور میں 61.0% سے 62.3% تک قابل ستائش اضافہ دیکھنے میں آیا ہے۔ تاہم، جو چیز text-embedding-3-small کو الگ کرتی ہے وہ نہ صرف اس کی بہتر کارکردگی ہے بلکہ اس کی استطاعت بھی ہے۔

ایول بینچ مارک ada v2 ٹیکسٹ ایمبیڈنگ-3-چھوٹا ٹیکسٹ ایمبیڈنگ-3-بڑا
MIRACL اوسط 31.4 44.0 54.9
MTEB اوسط 61.0 62.3 64.6

OpenAI نے قیمتوں کو نمایاں طور پر کم کر دیا ہے، جس سے ٹیکسٹ-ایمبیڈنگ-ada-5 کے مقابلے میں یہ 002 گنا زیادہ لاگت سے موثر ہے، فی 1k ٹوکن کی قیمت $0.0001 سے $0.00002 تک کم ہو گئی ہے۔ یہ ٹیکسٹ ایمبیڈنگ-3-چھوٹا نہ صرف ایک زیادہ موثر انتخاب بناتا ہے بلکہ ڈویلپرز کے لیے زیادہ قابل رسائی بھی ہے۔

ٹیکسٹ ایمبیڈنگ-3-بڑا

ایمبیڈنگ ماڈلز کی اگلی نسل کی نمائندگی کرتے ہوئے، ٹیکسٹ-ایمبیڈنگ-3-large 3072 ڈائمینشنز کے ساتھ ایمبیڈنگ کو سپورٹ کرتے ہوئے ابعاد میں خاطر خواہ اضافہ کرتا ہے۔ یہ بڑا ماڈل متنی مواد کی زیادہ تفصیلی اور باریک بینی کی نمائندگی کرتا ہے۔ کارکردگی کے لحاظ سے، ٹیکسٹ ایمبیڈنگ-3-large تمام بینچ مارکس میں اپنے پیشرو کو پیچھے چھوڑ دیتا ہے۔ MIRACL پر، اوسط سکور 31.4% سے بڑھ کر ایک متاثر کن 54.9% ہو گیا ہے، جو کثیر زبانوں کی بازیافت میں اس کی صلاحیت کو نمایاں کرتا ہے۔

ada v2 ٹیکسٹ ایمبیڈنگ-3-چھوٹا ٹیکسٹ ایمبیڈنگ-3-بڑا
سرایت کرنے کا سائز 1536 512 1536 256 1024 3072
اوسط MTEB سکور 61.0 61.6 62.3 62.0 64.1 64.6

اسی طرح، MTEB پر، اوسط سکور 61.0% سے بڑھ کر 64.6% ہو گیا ہے، جو انگریزی کے کاموں میں اپنی برتری کو ظاہر کرتا ہے۔ $0.00013 فی 1k ٹوکن کی قیمت پر، ٹیکسٹ ایمبیڈنگ-3-large کارکردگی کی عمدہ اور لاگت کی تاثیر کے درمیان توازن قائم کرتا ہے، جو ڈیولپرز کو اعلی جہتی سرایت کا مطالبہ کرنے والی ایپلی کیشنز کے لیے ایک مضبوط حل پیش کرتا ہے۔


سے ملو Google Lumiere AI، بارڈ کا ویڈیو بنانے والا کزن


ایمبیڈنگ کو مختصر کرنے کے لیے مقامی حمایت

ڈویلپرز کی متنوع ضروریات کو تسلیم کرتے ہوئے، OpenAI نے ایمبیڈنگ کو مختصر کرنے کے لیے مقامی مدد متعارف کرائی ہے۔ یہ جدید تکنیک ڈویلپرز کو ڈائمینشن API پیرامیٹر کو ایڈجسٹ کرکے ایمبیڈنگ سائز کو اپنی مرضی کے مطابق کرنے کی اجازت دیتی ہے۔ ایسا کرنے سے، ڈویلپر ایمبیڈنگ کی بنیادی خصوصیات سے سمجھوتہ کیے بغیر چھوٹے ویکٹر کے سائز کے لیے کچھ کارکردگی کو ٹریڈ آف کر سکتے ہیں۔ یہ لچک خاص طور پر ان منظرناموں میں قابل قدر ہے جہاں سسٹمز صرف ایک مخصوص سائز تک سرایت کرنے کی حمایت کرتے ہیں، جو ڈویلپرز کو استعمال کے مختلف منظرناموں کے لیے ایک ورسٹائل ٹول فراہم کرتے ہیں۔

نئے OpenAI ایمبیڈنگ ماڈلز دریافت کریں – ٹیکسٹ-ایمبیڈنگ-3-چھوٹا اور ٹیکسٹ-ایمبیڈنگ-3-بڑا- بہتر سستی، کارکردگی، اور بہت کچھ!
ٹیکسٹ-ایمبیڈنگ-3-سمال کی قابلیت کو اس کے پیشرو، ٹیکسٹ-ایمبیڈنگ-اڈا-5 کے مقابلے قیمتوں میں 002X کمی کے ذریعے واضح کیا گیا ہے، جو اسے ڈویلپرز کے لیے ایک سرمایہ کاری مؤثر انتخاب بناتا ہے (تصویری کریڈٹ)

خلاصہ یہ کہ اوپن اے آئی کے نئے ایمبیڈنگ ماڈلز کارکردگی، استطاعت اور کارکردگی میں ایک اہم قدم کی نمائندگی کرتے ہیں۔ چاہے ڈویلپرز ٹیکسٹ-ایمبیڈنگ-3-چھوٹے کی کمپیکٹ لیکن موثر نمائندگی کا انتخاب کریں یا ٹیکسٹ-ایمبیڈنگ-3-بڑے کی زیادہ وسیع اور تفصیلی ایمبیڈنگز کا انتخاب کریں، یہ ماڈلز ڈویلپرز کو ورسٹائل ٹولز کے ساتھ بااختیار بناتے ہیں تاکہ ان کے AI میں متنی ڈیٹا سے گہری بصیرت حاصل کی جا سکے۔ ایپلی کیشنز

نئے OpenAI ایمبیڈنگ ماڈلز کے بارے میں مزید تفصیلی معلومات کے لیے، کلک کریں۔ یہاں اور باضابطہ اعلان حاصل کریں۔

نمایاں تصویری کریڈٹ: Levart_Photographer/Unsplash

ٹائم اسٹیمپ:

سے زیادہ ڈیٹاکونومی