What Does The New OpenAI Embedding Models Offer?

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

नए ओपनएआई एम्बेडिंग मॉडल के साथ कृत्रिम बुद्धिमत्ता का क्षेत्र विकसित हो रहा है। वे यह फिर से परिभाषित करने के लिए तैयार हैं कि डेवलपर्स प्राकृतिक भाषा प्रसंस्करण के लिए कैसे दृष्टिकोण अपनाते हैं। दो अभूतपूर्व मॉडलों की खोज करने से पहले, प्रत्येक को एआई अनुप्रयोगों की क्षमताओं को बढ़ाने के लिए डिज़ाइन किया गया है, यहां बताया गया है घात लगाना मतलब है:

ओपनएआई की टेक्स्ट एम्बेडिंग टेक्स्ट स्ट्रिंग्स के बीच सहसंबंध को मापने के लिए एक मीट्रिक के रूप में काम करती है, जिसमें विभिन्न डोमेन में एप्लिकेशन ढूंढना शामिल है:

Search: किसी दिए गए क्वेरी स्ट्रिंग के लिए उनकी प्रासंगिकता के आधार पर परिणामों को रैंक करने के लिए उपयोग किया जाता है, जिससे खोज परिणामों की सटीकता बढ़ जाती है।
क्लस्टरिंग: टेक्स्ट स्ट्रिंग्स को उनकी समानता के आधार पर समूहीकृत करने, संबंधित जानकारी के संगठन को सुविधाजनक बनाने के लिए नियोजित।
अनुशंसाएँ: उन आइटमों का सुझाव देने के लिए अनुशंसा प्रणालियों में लागू किया जाता है जो अपने टेक्स्ट स्ट्रिंग्स में समानताएं साझा करते हैं, सुझावों के वैयक्तिकरण को बढ़ाते हैं।
असंगति का पता लगाये: अनियमित पैटर्न या डेटा बिंदुओं का पता लगाने में सहायता करते हुए, न्यूनतम संबंधितता वाले आउटलेर्स की पहचान करने के लिए नियोजित।
विविधता माप: समानता वितरण का विश्लेषण करने, डेटासेट या टेक्स्ट कॉर्पोरा के भीतर विविधता के आकलन को सक्षम करने के लिए उपयोग किया जाता है।
वर्गीकरण: वर्गीकरण कार्यों में तैनात जहां टेक्स्ट स्ट्रिंग्स को उनके सबसे समान लेबल के अनुसार वर्गीकृत किया जाता है, मशीन लर्निंग अनुप्रयोगों में लेबलिंग प्रक्रिया को सुव्यवस्थित किया जाता है।

अब आप नए OpenAI एम्बेडिंग मॉडल का पता लगाने के लिए तैयार हैं!

नए OpenAI एम्बेडिंग मॉडल आ गए हैं

नए ओपनएआई एम्बेडिंग मॉडल की शुरूआत प्राकृतिक भाषा प्रसंस्करण में एक महत्वपूर्ण छलांग का प्रतीक है, जो डेवलपर्स को पाठ्य सामग्री को बेहतर ढंग से प्रस्तुत करने और समझने में सक्षम बनाती है। आइए इन नवोन्मेषी मॉडलों के बारे में विस्तार से जानें: टेक्स्ट-एम्बेडिंग-3-छोटा और टेक्स्ट-एम्बेडिंग-3-बड़ा.

टेक्स्ट-एम्बेडिंग-3-छोटा

यह कॉम्पैक्ट लेकिन शक्तिशाली मॉडल अपने पूर्ववर्ती, text-embedding-ada-002 की तुलना में उल्लेखनीय प्रदर्शन को बढ़ावा देता है। बहु-भाषा पुनर्प्राप्ति बेंचमार्क (एमआईआरएसीएल) पर, औसत स्कोर 31.4% से बढ़कर प्रभावशाली 44.0% हो गया है। इसी तरह, इंग्लिश टास्क बेंचमार्क (MTEB) पर, औसत स्कोर में 61.0% से 62.3% तक सराहनीय वृद्धि देखी गई है। हालाँकि, जो चीज़ text-embedding-3-small को अलग करती है, वह न केवल इसका बेहतर प्रदर्शन है, बल्कि इसकी सामर्थ्य भी है।

इवल बेंचमार्क	एडीए v2	टेक्स्ट-एम्बेडिंग-3-छोटा	टेक्स्ट-एम्बेडिंग-3-बड़ा
MIRACL औसत	31.4	44.0	54.9
एमटीईबी औसत	61.0	62.3	64.6

OpenAI ने मूल्य निर्धारण को काफी कम कर दिया है, जिससे यह text-embedding-ada-5 की तुलना में 002 गुना अधिक लागत प्रभावी हो गया है, प्रति 1k टोकन की कीमत $0.0001 से कम होकर $0.00002 हो गई है। यह टेक्स्ट-एम्बेडिंग-3-स्मॉल को न केवल अधिक कुशल विकल्प बनाता है बल्कि डेवलपर्स के लिए अधिक सुलभ भी बनाता है।

टेक्स्ट-एम्बेडिंग-3-बड़ा

एम्बेडिंग मॉडल की अगली पीढ़ी का प्रतिनिधित्व करते हुए, टेक्स्ट-एम्बेडिंग-3-लार्ज आयामों में पर्याप्त वृद्धि पेश करता है, जो 3072 आयामों तक एम्बेडिंग का समर्थन करता है। यह बड़ा मॉडल पाठ्य सामग्री का अधिक विस्तृत और सूक्ष्म प्रतिनिधित्व प्रदान करता है। प्रदर्शन के मामले में, टेक्स्ट-एम्बेडिंग-3-लार्ज सभी बेंचमार्क में अपने पूर्ववर्ती से बेहतर है। MIRACL पर, औसत स्कोर 31.4% से बढ़कर प्रभावशाली 54.9% हो गया है, जो बहु-भाषा पुनर्प्राप्ति में इसकी क्षमता को उजागर करता है।

	एडीए v2	टेक्स्ट-एम्बेडिंग-3-छोटा		टेक्स्ट-एम्बेडिंग-3-बड़ा
एंबेडिंग का आकार	1536	512	1536	256	1024	3072
औसत एमटीईबी स्कोर	61.0	61.6	62.3	62.0	64.1	64.6

इसी तरह, एमटीईबी पर, औसत स्कोर 61.0% से बढ़कर 64.6% हो गया है, जो अंग्रेजी कार्यों में इसकी श्रेष्ठता को दर्शाता है। $0.00013 प्रति 1k टोकन की कीमत पर, टेक्स्ट-एम्बेडिंग-3-लार्ज प्रदर्शन उत्कृष्टता और लागत-प्रभावशीलता के बीच संतुलन बनाता है, डेवलपर्स को उच्च-आयामी एम्बेडिंग की मांग करने वाले अनुप्रयोगों के लिए एक मजबूत समाधान प्रदान करता है।

मिलना गूगल लुमियरे एआई, बार्ड का वीडियो निर्माता चचेरा भाई

एम्बेडिंग को छोटा करने के लिए मूल समर्थन

डेवलपर्स की विविध आवश्यकताओं को पहचानते हुए, ओपनएआई ने एम्बेडिंग को छोटा करने के लिए मूल समर्थन की शुरुआत की है। यह नवीन तकनीक डेवलपर्स को आयाम एपीआई पैरामीटर को समायोजित करके एम्बेडिंग आकार को अनुकूलित करने की अनुमति देती है। ऐसा करने से, डेवलपर्स एम्बेडिंग के मूलभूत गुणों से समझौता किए बिना छोटे वेक्टर आकार के लिए कुछ प्रदर्शन का व्यापार कर सकते हैं। यह लचीलापन उन परिदृश्यों में विशेष रूप से मूल्यवान है जहां सिस्टम केवल एक निश्चित आकार तक एम्बेडिंग का समर्थन करते हैं, जिससे डेवलपर्स को विभिन्न उपयोग परिदृश्यों के लिए एक बहुमुखी उपकरण प्रदान किया जाता है।

संक्षेप में, OpenAI के नए एम्बेडिंग मॉडल दक्षता, सामर्थ्य और प्रदर्शन में एक महत्वपूर्ण कदम का प्रतिनिधित्व करते हैं। चाहे डेवलपर्स टेक्स्ट-एम्बेडिंग-3-छोटे के कॉम्पैक्ट लेकिन कुशल प्रतिनिधित्व का विकल्प चुनें या टेक्स्ट-एम्बेडिंग-3-बड़े के अधिक व्यापक और विस्तृत एम्बेडिंग का, ये मॉडल डेवलपर्स को उनके एआई में टेक्स्ट डेटा से गहरी अंतर्दृष्टि निकालने के लिए बहुमुखी टूल के साथ सशक्त बनाते हैं। अनुप्रयोग।

नए OpenAI एम्बेडिंग मॉडल के बारे में अधिक विस्तृत जानकारी के लिए क्लिक करें यहाँ उत्पन्न करें और आधिकारिक घोषणा प्राप्त करें।

विशेष रुप से प्रदर्शित छवि क्रेडिट: लेवार्ट_फ़ोटोग्राफ़र/अनस्प्लैश

एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
स्रोत: https://dataconomy.com/2024/01/26/new-openai-embedding-models/

समय टिकट: जनवरी ७,२०२१

समय टिकट: फ़रवरी 1, 2024

प्लेटो द्वारा पुनर्प्रकाशित

अमेज़ॅन टाइटन इमेज जेनरेटर गेम को बदलने के लिए यहां है

टर्मिनेटर निर्देशक एआई को स्काईनेट बनने देने से डरते हैं

एफटीसी ने अमेज़ॅन पर मुकदमा दायर किया और कंपनी अमेज़ॅन मुकदमे में आश्वस्त है

एनएफटी प्रचार की रेल दुर्घटना जांच के दायरे में है

फ़ुटबॉल ऑस्ट्रेलिया डेटा उल्लंघन - एक दुर्भाग्यपूर्ण आत्मघाती लक्ष्य

हमारे बारे में

ऊर्ध्वाधर खोज और ऐ

मंच

जुड़े रहें

लेखा