नए ओपनएआई एम्बेडिंग मॉडल के साथ कृत्रिम बुद्धिमत्ता का क्षेत्र विकसित हो रहा है। वे यह फिर से परिभाषित करने के लिए तैयार हैं कि डेवलपर्स प्राकृतिक भाषा प्रसंस्करण के लिए कैसे दृष्टिकोण अपनाते हैं। दो अभूतपूर्व मॉडलों की खोज करने से पहले, प्रत्येक को एआई अनुप्रयोगों की क्षमताओं को बढ़ाने के लिए डिज़ाइन किया गया है, यहां बताया गया है घात लगाना मतलब है:
ओपनएआई की टेक्स्ट एम्बेडिंग टेक्स्ट स्ट्रिंग्स के बीच सहसंबंध को मापने के लिए एक मीट्रिक के रूप में काम करती है, जिसमें विभिन्न डोमेन में एप्लिकेशन ढूंढना शामिल है:
- Search: किसी दिए गए क्वेरी स्ट्रिंग के लिए उनकी प्रासंगिकता के आधार पर परिणामों को रैंक करने के लिए उपयोग किया जाता है, जिससे खोज परिणामों की सटीकता बढ़ जाती है।
- क्लस्टरिंग: टेक्स्ट स्ट्रिंग्स को उनकी समानता के आधार पर समूहीकृत करने, संबंधित जानकारी के संगठन को सुविधाजनक बनाने के लिए नियोजित।
- अनुशंसाएँ: उन आइटमों का सुझाव देने के लिए अनुशंसा प्रणालियों में लागू किया जाता है जो अपने टेक्स्ट स्ट्रिंग्स में समानताएं साझा करते हैं, सुझावों के वैयक्तिकरण को बढ़ाते हैं।
- असंगति का पता लगाये: अनियमित पैटर्न या डेटा बिंदुओं का पता लगाने में सहायता करते हुए, न्यूनतम संबंधितता वाले आउटलेर्स की पहचान करने के लिए नियोजित।
- विविधता माप: समानता वितरण का विश्लेषण करने, डेटासेट या टेक्स्ट कॉर्पोरा के भीतर विविधता के आकलन को सक्षम करने के लिए उपयोग किया जाता है।
- वर्गीकरण: वर्गीकरण कार्यों में तैनात जहां टेक्स्ट स्ट्रिंग्स को उनके सबसे समान लेबल के अनुसार वर्गीकृत किया जाता है, मशीन लर्निंग अनुप्रयोगों में लेबलिंग प्रक्रिया को सुव्यवस्थित किया जाता है।
अब आप नए OpenAI एम्बेडिंग मॉडल का पता लगाने के लिए तैयार हैं!
नए OpenAI एम्बेडिंग मॉडल आ गए हैं
नए ओपनएआई एम्बेडिंग मॉडल की शुरूआत प्राकृतिक भाषा प्रसंस्करण में एक महत्वपूर्ण छलांग का प्रतीक है, जो डेवलपर्स को पाठ्य सामग्री को बेहतर ढंग से प्रस्तुत करने और समझने में सक्षम बनाती है। आइए इन नवोन्मेषी मॉडलों के बारे में विस्तार से जानें: टेक्स्ट-एम्बेडिंग-3-छोटा और टेक्स्ट-एम्बेडिंग-3-बड़ा.
टेक्स्ट-एम्बेडिंग-3-छोटा
यह कॉम्पैक्ट लेकिन शक्तिशाली मॉडल अपने पूर्ववर्ती, text-embedding-ada-002 की तुलना में उल्लेखनीय प्रदर्शन को बढ़ावा देता है। बहु-भाषा पुनर्प्राप्ति बेंचमार्क (एमआईआरएसीएल) पर, औसत स्कोर 31.4% से बढ़कर प्रभावशाली 44.0% हो गया है। इसी तरह, इंग्लिश टास्क बेंचमार्क (MTEB) पर, औसत स्कोर में 61.0% से 62.3% तक सराहनीय वृद्धि देखी गई है। हालाँकि, जो चीज़ text-embedding-3-small को अलग करती है, वह न केवल इसका बेहतर प्रदर्शन है, बल्कि इसकी सामर्थ्य भी है।
इवल बेंचमार्क | एडीए v2 | टेक्स्ट-एम्बेडिंग-3-छोटा | टेक्स्ट-एम्बेडिंग-3-बड़ा |
MIRACL औसत | 31.4 | 44.0 | 54.9 |
एमटीईबी औसत | 61.0 | 62.3 | 64.6 |
OpenAI ने मूल्य निर्धारण को काफी कम कर दिया है, जिससे यह text-embedding-ada-5 की तुलना में 002 गुना अधिक लागत प्रभावी हो गया है, प्रति 1k टोकन की कीमत $0.0001 से कम होकर $0.00002 हो गई है। यह टेक्स्ट-एम्बेडिंग-3-स्मॉल को न केवल अधिक कुशल विकल्प बनाता है बल्कि डेवलपर्स के लिए अधिक सुलभ भी बनाता है।
टेक्स्ट-एम्बेडिंग-3-बड़ा
एम्बेडिंग मॉडल की अगली पीढ़ी का प्रतिनिधित्व करते हुए, टेक्स्ट-एम्बेडिंग-3-लार्ज आयामों में पर्याप्त वृद्धि पेश करता है, जो 3072 आयामों तक एम्बेडिंग का समर्थन करता है। यह बड़ा मॉडल पाठ्य सामग्री का अधिक विस्तृत और सूक्ष्म प्रतिनिधित्व प्रदान करता है। प्रदर्शन के मामले में, टेक्स्ट-एम्बेडिंग-3-लार्ज सभी बेंचमार्क में अपने पूर्ववर्ती से बेहतर है। MIRACL पर, औसत स्कोर 31.4% से बढ़कर प्रभावशाली 54.9% हो गया है, जो बहु-भाषा पुनर्प्राप्ति में इसकी क्षमता को उजागर करता है।
एडीए v2 | टेक्स्ट-एम्बेडिंग-3-छोटा | टेक्स्ट-एम्बेडिंग-3-बड़ा | ||||
एंबेडिंग का आकार | 1536 | 512 | 1536 | 256 | 1024 | 3072 |
औसत एमटीईबी स्कोर | 61.0 | 61.6 | 62.3 | 62.0 | 64.1 | 64.6 |
इसी तरह, एमटीईबी पर, औसत स्कोर 61.0% से बढ़कर 64.6% हो गया है, जो अंग्रेजी कार्यों में इसकी श्रेष्ठता को दर्शाता है। $0.00013 प्रति 1k टोकन की कीमत पर, टेक्स्ट-एम्बेडिंग-3-लार्ज प्रदर्शन उत्कृष्टता और लागत-प्रभावशीलता के बीच संतुलन बनाता है, डेवलपर्स को उच्च-आयामी एम्बेडिंग की मांग करने वाले अनुप्रयोगों के लिए एक मजबूत समाधान प्रदान करता है।
मिलना गूगल लुमियरे एआई, बार्ड का वीडियो निर्माता चचेरा भाई
एम्बेडिंग को छोटा करने के लिए मूल समर्थन
डेवलपर्स की विविध आवश्यकताओं को पहचानते हुए, ओपनएआई ने एम्बेडिंग को छोटा करने के लिए मूल समर्थन की शुरुआत की है। यह नवीन तकनीक डेवलपर्स को आयाम एपीआई पैरामीटर को समायोजित करके एम्बेडिंग आकार को अनुकूलित करने की अनुमति देती है। ऐसा करने से, डेवलपर्स एम्बेडिंग के मूलभूत गुणों से समझौता किए बिना छोटे वेक्टर आकार के लिए कुछ प्रदर्शन का व्यापार कर सकते हैं। यह लचीलापन उन परिदृश्यों में विशेष रूप से मूल्यवान है जहां सिस्टम केवल एक निश्चित आकार तक एम्बेडिंग का समर्थन करते हैं, जिससे डेवलपर्स को विभिन्न उपयोग परिदृश्यों के लिए एक बहुमुखी उपकरण प्रदान किया जाता है।
संक्षेप में, OpenAI के नए एम्बेडिंग मॉडल दक्षता, सामर्थ्य और प्रदर्शन में एक महत्वपूर्ण कदम का प्रतिनिधित्व करते हैं। चाहे डेवलपर्स टेक्स्ट-एम्बेडिंग-3-छोटे के कॉम्पैक्ट लेकिन कुशल प्रतिनिधित्व का विकल्प चुनें या टेक्स्ट-एम्बेडिंग-3-बड़े के अधिक व्यापक और विस्तृत एम्बेडिंग का, ये मॉडल डेवलपर्स को उनके एआई में टेक्स्ट डेटा से गहरी अंतर्दृष्टि निकालने के लिए बहुमुखी टूल के साथ सशक्त बनाते हैं। अनुप्रयोग।
नए OpenAI एम्बेडिंग मॉडल के बारे में अधिक विस्तृत जानकारी के लिए क्लिक करें यहाँ उत्पन्न करें और आधिकारिक घोषणा प्राप्त करें।
विशेष रुप से प्रदर्शित छवि क्रेडिट: लेवार्ट_फ़ोटोग्राफ़र/अनस्प्लैश
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
- स्रोत: https://dataconomy.com/2024/01/26/new-openai-embedding-models/
- :हैस
- :है
- :नहीं
- :कहाँ
- $यूपी
- 1
- 31
- 54
- a
- About
- सुलभ
- अनुसार
- के पार
- का समायोजन
- प्रगति
- AI
- की अनुमति देता है
- भी
- an
- का विश्लेषण
- और
- घोषणा
- अलग
- एपीआई
- अनुप्रयोगों
- लागू
- दृष्टिकोण
- हैं
- कृत्रिम
- कृत्रिम बुद्धिमत्ता
- AS
- मूल्यांकन
- At
- औसत
- शेष
- आधारित
- से पहले
- बेंचमार्क
- मानक
- बेहतर
- के बीच
- खंड
- बढ़ावा
- लेकिन
- by
- कर सकते हैं
- क्षमताओं
- खानपान
- कुछ
- चुनाव
- वर्गीकरण
- क्लिक करें
- चढ़ गया
- सराहनीय
- सघन
- तुलना
- समझौता
- सामग्री
- जारी
- सह - संबंध
- प्रभावी लागत
- श्रेय
- अनुकूलित
- तिथि
- डेटा अंक
- डेटासेट
- और गहरा
- गड्ढा
- मांग
- तैनात
- बनाया गया
- विस्तृत
- विवरण
- खोज
- डेवलपर
- डेवलपर्स
- आयाम
- अन्य वायरल पोस्ट से
- वितरण
- कई
- विविधता
- कर देता है
- कर
- डोमेन
- से प्रत्येक
- दक्षता
- कुशल
- ऊपर उठाना
- embedding
- कार्यरत
- सशक्त
- समर्थकारी
- अंग्रेज़ी
- वर्धित
- बढ़ाने
- विकसित करना
- उत्कृष्टता
- प्रदर्श
- का पता लगाने
- तलाश
- व्यापक
- उद्धरण
- अभिनंदन करना
- खोज
- लचीलापन
- के लिए
- आगे
- से
- मौलिक
- नाप
- पीढ़ी
- मिल
- दी
- अभूतपूर्व
- है
- यहाँ उत्पन्न करें
- हाई
- पर प्रकाश डाला
- कैसे
- तथापि
- HTTPS
- पहचान करना
- की छवि
- प्रभावशाली
- in
- सहित
- बढ़ना
- करें-
- अभिनव
- अंतर्दृष्टि
- बुद्धि
- में
- द्वारा प्रस्तुत
- परिचय
- IT
- आइटम
- आईटी इस
- जेपीजी
- केवल
- लेबल
- लेबलिंग
- भाषा
- बड़ा
- छलांग
- सीख रहा हूँ
- कम
- मशीन
- यंत्र अधिगम
- निर्माता
- बनाता है
- निर्माण
- अधिकतम-चौड़ाई
- मतलब
- मीट्रिक
- कम से कम
- आदर्श
- मॉडल
- अधिक
- अधिक कुशल
- अधिकांश
- देशी
- प्राकृतिक
- प्राकृतिक भाषा
- प्राकृतिक भाषा संसाधन
- की जरूरत है
- नया
- अगला
- ध्यान देने योग्य
- सूक्ष्म
- of
- प्रस्ताव
- की पेशकश
- सरकारी
- on
- ONE
- केवल
- OpenAI
- or
- संगठन
- परिणामों
- के ऊपर
- प्राचल
- विशेष रूप से
- पैटर्न उपयोग करें
- प्रति
- प्रदर्शन
- निजीकरण
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- अंक
- शक्तिशाली
- शुद्धता
- पूर्वज
- मूल्य
- कीमत निर्धारण
- प्रक्रिया
- प्रसंस्करण
- गुण
- प्रदान करता है
- प्रदान कर
- कौशल
- रैंक
- तैयार
- क्षेत्र
- सिफारिश
- फिर से परिभाषित
- घटी
- कमी
- सम्बंधित
- प्रासंगिकता
- प्रतिनिधित्व
- प्रतिनिधित्व
- परिणाम
- बहाली
- मजबूत
- परिदृश्यों
- स्कोर
- Search
- देखा
- सेवा
- सेट
- सेट
- Share
- प्रदर्शन
- को दिखाने
- महत्वपूर्ण
- काफी
- समान
- समानता
- उसी प्रकार
- आकार
- छोटे
- So
- बढ़ गई
- समाधान
- कुछ
- कदम
- व्यवस्थित बनाने
- हड़तालों
- तार
- पर्याप्त
- सुझाव
- सारांश
- समर्थन
- सहायक
- बढ़ी
- सिस्टम
- तालिका
- कार्य
- तकनीक
- शर्तों
- टेक्स्ट
- शाब्दिक
- कि
- RSI
- लेकिन हाल ही
- इन
- वे
- इसका
- बार
- सेवा मेरे
- टोकन
- साधन
- उपकरण
- दो
- समझना
- प्रयोग
- उपयोग किया
- मूल्यवान
- विभिन्न
- बहुमुखी
- वीडियो
- क्या
- या
- साथ में
- अंदर
- बिना
- अभी तक
- इसलिए आप
- जेफिरनेट