रोमांचक एआई दक्षता: छोटे मॉडलों का सम्मिश्रण बड़े समकक्षों से आगे निकल जाता है

रोमांचक एआई दक्षता: छोटे मॉडलों का सम्मिश्रण बड़े समकक्षों से आगे निकल जाता है

स्रोत नोड: 3069830

In recent years, the field of conversational AI has been significantly influenced by models like ChatGPT, characterized by their expansive parameter sizes. However, this approach comes with substantial demands on computational resources and memory. A study now introduces a novel concept: blending multiple smaller AI models to achieve or surpass the performance of larger models. This approach, termed “Blending,” एकीकृत multiple chat AIs, offering an effective solution to the computational challenges of large models.

चाई अनुसंधान मंच पर एक बड़े उपयोगकर्ता आधार के साथ तीस दिनों तक किए गए शोध से पता चलता है कि विशिष्ट छोटे मॉडलों का सम्मिश्रण संभावित रूप से चैटजीपीटी जैसे बहुत बड़े मॉडलों की क्षमताओं से बेहतर प्रदर्शन कर सकता है या उनकी क्षमताओं से मेल खा सकता है। उदाहरण के लिए, 6B/13B मापदंडों के साथ केवल तीन मॉडलों को एकीकृत करना 175B+ मापदंडों के साथ ChatGPT जैसे काफी बड़े मॉडलों के प्रदर्शन मेट्रिक्स को प्रतिद्वंद्वी या उससे भी आगे कर सकता है।

The increasing reliance on pre-trained large language models (LLMs) for diverse applications, particularly in chat AI, has led to a surge in the development of models with massive numbers of parameters. However, these large models require specialized infrastructure and have significant inference overheads, limiting their accessibility. The Blended approach, on the other hand, offers a more efficient alternative without compromising on conversational quality.

मिश्रित एआई की प्रभावशीलता इसके उपयोगकर्ता जुड़ाव और प्रतिधारण दरों में स्पष्ट है। सीएचएआई प्लेटफॉर्म पर बड़े पैमाने पर ए/बी परीक्षणों के दौरान, तीन 6-13बी पैरामीटर एलएलएम से बने मिश्रित संयोजन ने ओपनएआई के 175बी+ पैरामीटर चैटजीपीटी को पछाड़ दिया, जिससे काफी अधिक उपयोगकर्ता प्रतिधारण और जुड़ाव हासिल हुआ। यह इंगित करता है कि उपयोगकर्ताओं ने मिश्रित चैट एआई को अधिक आकर्षक, मनोरंजक और उपयोगी पाया, जबकि बड़े मॉडलों की अनुमान लागत और मेमोरी ओवरहेड के केवल एक अंश की आवश्यकता होती है।

अध्ययन की पद्धति में बायेसियन सांख्यिकीय सिद्धांतों के आधार पर संयोजन शामिल है, जहां एक विशेष प्रतिक्रिया की संभावना को सभी प्रशंसनीय चैट एआई मापदंडों पर ली गई सीमांत अपेक्षा के रूप में अवधारणाबद्ध किया गया है। ब्लेंडेड बेतरतीब ढंग से चैट एआई का चयन करता है जो वर्तमान प्रतिक्रिया उत्पन्न करता है, जिससे विभिन्न चैट एआई आउटपुट को परोक्ष रूप से प्रभावित कर सकते हैं। इसके परिणामस्वरूप व्यक्तिगत चैट एआई शक्तियों का सम्मिश्रण होता है, जिससे अधिक आकर्षक और विविध प्रतिक्रियाएँ प्राप्त होती हैं।

2024 के लिए एआई और मशीन लर्निंग रुझानों में सफलताएं अधिक व्यावहारिक, कुशल और अनुकूलन योग्य एआई मॉडल की ओर बढ़ने पर जोर देती हैं। जैसे-जैसे AI व्यावसायिक संचालन में अधिक एकीकृत होता जा रहा है, ऐसे मॉडलों की मांग बढ़ रही है जो विशिष्ट आवश्यकताओं को पूरा करते हैं, बेहतर गोपनीयता और सुरक्षा प्रदान करते हैं। यह बदलाव मिश्रित दृष्टिकोण के मूल सिद्धांतों के अनुरूप है, जो दक्षता, लागत-प्रभावशीलता और अनुकूलनशीलता पर जोर देता है।

अंत में, मिश्रित विधि एआई विकास में एक महत्वपूर्ण प्रगति का प्रतिनिधित्व करती है। कई छोटे मॉडलों को मिलाकर, यह एक कुशल, लागत प्रभावी समाधान प्रदान करता है जो बड़े, अधिक संसाधन-गहन मॉडल की तुलना में उपयोगकर्ता जुड़ाव और प्रतिधारण को बनाए रखता है और कुछ मामलों में बढ़ाता है। यह दृष्टिकोण न केवल बड़े पैमाने पर एआई की व्यावहारिक सीमाओं को संबोधित करता है बल्कि विभिन्न क्षेत्रों में एआई अनुप्रयोगों के लिए नई संभावनाएं भी खोलता है।

छवि स्रोत: शटरस्टॉक

समय टिकट:

से अधिक ब्लॉकचैन न्यूज

जेमिनी का साप्ताहिक अपडेट: पेपाल ने PYUSD स्टेबलकॉइन लॉन्च किया, कॉइनबेस ने बेस लेयर-2 का अनावरण किया, और एप्टोस ने माइक्रोसॉफ्ट पार्टनरशिप की घोषणा की

स्रोत नोड: 2818281
समय टिकट: अगस्त 12, 2023