नए OpenAI एम्बेडिंग मॉडल क्या ऑफ़र करते हैं?

नए OpenAI एम्बेडिंग मॉडल क्या ऑफ़र करते हैं?

स्रोत नोड: 3084949

नए ओपनएआई एम्बेडिंग मॉडल के साथ कृत्रिम बुद्धिमत्ता का क्षेत्र विकसित हो रहा है। वे यह फिर से परिभाषित करने के लिए तैयार हैं कि डेवलपर्स प्राकृतिक भाषा प्रसंस्करण के लिए कैसे दृष्टिकोण अपनाते हैं। दो अभूतपूर्व मॉडलों की खोज करने से पहले, प्रत्येक को एआई अनुप्रयोगों की क्षमताओं को बढ़ाने के लिए डिज़ाइन किया गया है, यहां बताया गया है घात लगाना मतलब है:

ओपनएआई की टेक्स्ट एम्बेडिंग टेक्स्ट स्ट्रिंग्स के बीच सहसंबंध को मापने के लिए एक मीट्रिक के रूप में काम करती है, जिसमें विभिन्न डोमेन में एप्लिकेशन ढूंढना शामिल है:

  • Search: किसी दिए गए क्वेरी स्ट्रिंग के लिए उनकी प्रासंगिकता के आधार पर परिणामों को रैंक करने के लिए उपयोग किया जाता है, जिससे खोज परिणामों की सटीकता बढ़ जाती है।
  • क्लस्टरिंग: टेक्स्ट स्ट्रिंग्स को उनकी समानता के आधार पर समूहीकृत करने, संबंधित जानकारी के संगठन को सुविधाजनक बनाने के लिए नियोजित।
  • अनुशंसाएँ: उन आइटमों का सुझाव देने के लिए अनुशंसा प्रणालियों में लागू किया जाता है जो अपने टेक्स्ट स्ट्रिंग्स में समानताएं साझा करते हैं, सुझावों के वैयक्तिकरण को बढ़ाते हैं।
  • असंगति का पता लगाये: अनियमित पैटर्न या डेटा बिंदुओं का पता लगाने में सहायता करते हुए, न्यूनतम संबंधितता वाले आउटलेर्स की पहचान करने के लिए नियोजित।
  • विविधता माप: समानता वितरण का विश्लेषण करने, डेटासेट या टेक्स्ट कॉर्पोरा के भीतर विविधता के आकलन को सक्षम करने के लिए उपयोग किया जाता है।
  • वर्गीकरण: वर्गीकरण कार्यों में तैनात जहां टेक्स्ट स्ट्रिंग्स को उनके सबसे समान लेबल के अनुसार वर्गीकृत किया जाता है, मशीन लर्निंग अनुप्रयोगों में लेबलिंग प्रक्रिया को सुव्यवस्थित किया जाता है।

अब आप नए OpenAI एम्बेडिंग मॉडल का पता लगाने के लिए तैयार हैं!

नए OpenAI एम्बेडिंग मॉडल आ गए हैं

नए ओपनएआई एम्बेडिंग मॉडल की शुरूआत प्राकृतिक भाषा प्रसंस्करण में एक महत्वपूर्ण छलांग का प्रतीक है, जो डेवलपर्स को पाठ्य सामग्री को बेहतर ढंग से प्रस्तुत करने और समझने में सक्षम बनाती है। आइए इन नवोन्मेषी मॉडलों के बारे में विस्तार से जानें: टेक्स्ट-एम्बेडिंग-3-छोटा और टेक्स्ट-एम्बेडिंग-3-बड़ा.

नए ओपनएआई एम्बेडिंग मॉडल खोजें - टेक्स्ट-एम्बेडिंग-3-छोटा और टेक्स्ट-एम्बेडिंग-3-बड़ा - उन्नत सामर्थ्य, प्रदर्शन और बहुत कुछ!
नए ओपनएआई एम्बेडिंग मॉडल, टेक्स्ट-एम्बेडिंग-3-छोटा और टेक्स्ट-एम्बेडिंग-3-बड़ा, प्राकृतिक भाषा प्रसंस्करण में महत्वपूर्ण प्रगति दिखाते हैं, जो विविध डेवलपर आवश्यकताओं को पूरा करते हैं (छवि क्रेडिट)

टेक्स्ट-एम्बेडिंग-3-छोटा

यह कॉम्पैक्ट लेकिन शक्तिशाली मॉडल अपने पूर्ववर्ती, text-embedding-ada-002 की तुलना में उल्लेखनीय प्रदर्शन को बढ़ावा देता है। बहु-भाषा पुनर्प्राप्ति बेंचमार्क (एमआईआरएसीएल) पर, औसत स्कोर 31.4% से बढ़कर प्रभावशाली 44.0% हो गया है। इसी तरह, इंग्लिश टास्क बेंचमार्क (MTEB) पर, औसत स्कोर में 61.0% से 62.3% तक सराहनीय वृद्धि देखी गई है। हालाँकि, जो चीज़ text-embedding-3-small को अलग करती है, वह न केवल इसका बेहतर प्रदर्शन है, बल्कि इसकी सामर्थ्य भी है।

इवल बेंचमार्क एडीए v2 टेक्स्ट-एम्बेडिंग-3-छोटा टेक्स्ट-एम्बेडिंग-3-बड़ा
MIRACL औसत 31.4 44.0 54.9
एमटीईबी औसत 61.0 62.3 64.6

OpenAI ने मूल्य निर्धारण को काफी कम कर दिया है, जिससे यह text-embedding-ada-5 की तुलना में 002 गुना अधिक लागत प्रभावी हो गया है, प्रति 1k टोकन की कीमत $0.0001 से कम होकर $0.00002 हो गई है। यह टेक्स्ट-एम्बेडिंग-3-स्मॉल को न केवल अधिक कुशल विकल्प बनाता है बल्कि डेवलपर्स के लिए अधिक सुलभ भी बनाता है।

टेक्स्ट-एम्बेडिंग-3-बड़ा

एम्बेडिंग मॉडल की अगली पीढ़ी का प्रतिनिधित्व करते हुए, टेक्स्ट-एम्बेडिंग-3-लार्ज आयामों में पर्याप्त वृद्धि पेश करता है, जो 3072 आयामों तक एम्बेडिंग का समर्थन करता है। यह बड़ा मॉडल पाठ्य सामग्री का अधिक विस्तृत और सूक्ष्म प्रतिनिधित्व प्रदान करता है। प्रदर्शन के मामले में, टेक्स्ट-एम्बेडिंग-3-लार्ज सभी बेंचमार्क में अपने पूर्ववर्ती से बेहतर है। MIRACL पर, औसत स्कोर 31.4% से बढ़कर प्रभावशाली 54.9% हो गया है, जो बहु-भाषा पुनर्प्राप्ति में इसकी क्षमता को उजागर करता है।

एडीए v2 टेक्स्ट-एम्बेडिंग-3-छोटा टेक्स्ट-एम्बेडिंग-3-बड़ा
एंबेडिंग का आकार 1536 512 1536 256 1024 3072
औसत एमटीईबी स्कोर 61.0 61.6 62.3 62.0 64.1 64.6

इसी तरह, एमटीईबी पर, औसत स्कोर 61.0% से बढ़कर 64.6% हो गया है, जो अंग्रेजी कार्यों में इसकी श्रेष्ठता को दर्शाता है। $0.00013 प्रति 1k टोकन की कीमत पर, टेक्स्ट-एम्बेडिंग-3-लार्ज प्रदर्शन उत्कृष्टता और लागत-प्रभावशीलता के बीच संतुलन बनाता है, डेवलपर्स को उच्च-आयामी एम्बेडिंग की मांग करने वाले अनुप्रयोगों के लिए एक मजबूत समाधान प्रदान करता है।


मिलना गूगल लुमियरे एआई, बार्ड का वीडियो निर्माता चचेरा भाई


एम्बेडिंग को छोटा करने के लिए मूल समर्थन

डेवलपर्स की विविध आवश्यकताओं को पहचानते हुए, ओपनएआई ने एम्बेडिंग को छोटा करने के लिए मूल समर्थन की शुरुआत की है। यह नवीन तकनीक डेवलपर्स को आयाम एपीआई पैरामीटर को समायोजित करके एम्बेडिंग आकार को अनुकूलित करने की अनुमति देती है। ऐसा करने से, डेवलपर्स एम्बेडिंग के मूलभूत गुणों से समझौता किए बिना छोटे वेक्टर आकार के लिए कुछ प्रदर्शन का व्यापार कर सकते हैं। यह लचीलापन उन परिदृश्यों में विशेष रूप से मूल्यवान है जहां सिस्टम केवल एक निश्चित आकार तक एम्बेडिंग का समर्थन करते हैं, जिससे डेवलपर्स को विभिन्न उपयोग परिदृश्यों के लिए एक बहुमुखी उपकरण प्रदान किया जाता है।

नए ओपनएआई एम्बेडिंग मॉडल खोजें - टेक्स्ट-एम्बेडिंग-3-छोटा और टेक्स्ट-एम्बेडिंग-3-बड़ा - उन्नत सामर्थ्य, प्रदर्शन और बहुत कुछ!
टेक्स्ट-एम्बेडिंग-3-स्मॉल की सामर्थ्य इसके पूर्ववर्ती, टेक्स्ट-एम्बेडिंग-एडीए-5 की तुलना में मूल्य निर्धारण में 002X की कमी से रेखांकित होती है, जिससे यह डेवलपर्स के लिए एक लागत प्रभावी विकल्प बन जाता है (छवि क्रेडिट)

संक्षेप में, OpenAI के नए एम्बेडिंग मॉडल दक्षता, सामर्थ्य और प्रदर्शन में एक महत्वपूर्ण कदम का प्रतिनिधित्व करते हैं। चाहे डेवलपर्स टेक्स्ट-एम्बेडिंग-3-छोटे के कॉम्पैक्ट लेकिन कुशल प्रतिनिधित्व का विकल्प चुनें या टेक्स्ट-एम्बेडिंग-3-बड़े के अधिक व्यापक और विस्तृत एम्बेडिंग का, ये मॉडल डेवलपर्स को उनके एआई में टेक्स्ट डेटा से गहरी अंतर्दृष्टि निकालने के लिए बहुमुखी टूल के साथ सशक्त बनाते हैं। अनुप्रयोग।

नए OpenAI एम्बेडिंग मॉडल के बारे में अधिक विस्तृत जानकारी के लिए क्लिक करें यहाँ उत्पन्न करें और आधिकारिक घोषणा प्राप्त करें।

विशेष रुप से प्रदर्शित छवि क्रेडिट: लेवार्ट_फ़ोटोग्राफ़र/अनस्प्लैश

समय टिकट:

से अधिक डाटाकॉनॉमी