Dolly 2.0: ChatGPT Open Source Alternative For Commercial Use

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

डॉली 2.0: वाणिज्यिक उपयोग के लिए चैटजीपीटी ओपन सोर्स वैकल्पिक
लेखक से छवि | बिंग छवि निर्माता

डॉली 2.0 एक खुला स्रोत, अनुदेश-अनुसरणित, बड़ा भाषा मॉडल (एलएलएम) है जिसे मानव-जनित डेटासेट पर ठीक से ट्यून किया गया था। इसका उपयोग अनुसंधान और व्यावसायिक दोनों उद्देश्यों के लिए किया जा सकता है।

डॉली 2.0: वाणिज्यिक उपयोग के लिए चैटजीपीटी ओपन सोर्स वैकल्पिक
से छवि रामअनंत1 द्वारा हगिंग फेस स्पेस

इससे पहले, डेटाब्रिक्स टीम ने जारी किया था डॉली 1.0, एलएलएम, जो चैटजीपीटी जैसी अनुदेशन क्षमता प्रदर्शित करता है और प्रशिक्षण की लागत $30 से कम है। यह स्टैनफोर्ड अल्पाका टीम डेटासेट का उपयोग कर रहा था, जो एक प्रतिबंधित लाइसेंस (केवल अनुसंधान) के तहत था।

डॉली 2.0 ने 12बी पैरामीटर भाषा मॉडल को ठीक करके इस समस्या का समाधान किया है (पाइथिया) निम्नलिखित डेटासेट में उच्च गुणवत्ता वाले मानव-जनित निर्देश पर, जिसे डेटब्रिक्स कर्मचारी द्वारा लेबल किया गया था। मॉडल और डेटासेट दोनों व्यावसायिक उपयोग के लिए उपलब्ध हैं।

डॉली 1.0 को स्टैनफोर्ड अल्पाका डेटासेट पर प्रशिक्षित किया गया था, जिसे ओपनएआई एपीआई का उपयोग करके बनाया गया था। डेटासेट में ChatGPT का आउटपुट शामिल है और यह किसी को भी OpenAI के साथ प्रतिस्पर्धा करने के लिए इसका उपयोग करने से रोकता है। संक्षेप में, आप इस डेटासेट के आधार पर एक व्यावसायिक चैटबॉट या भाषा एप्लिकेशन नहीं बना सकते।

पिछले कुछ हफ़्तों में जारी किए गए अधिकांश नवीनतम मॉडल समान मुद्दों से पीड़ित थे, जैसे मॉडल उसकी ऊन का कपड़ा, कोअला, GPT4सभी, तथा विकग्ना. इससे निपटने के लिए, हमें नए उच्च-गुणवत्ता वाले डेटासेट बनाने की आवश्यकता है जिनका उपयोग व्यावसायिक उपयोग के लिए किया जा सकता है, और डेटाब्रिक्स टीम ने डेटाब्रिक्स-डॉली-15k डेटासेट के साथ यही किया है।

नए डेटासेट में 15,000 उच्च-गुणवत्ता वाले मानव-लेबल संकेत/प्रतिक्रिया जोड़े शामिल हैं जिनका उपयोग बड़े भाषा मॉडल को ट्यून करने वाले निर्देश को डिजाइन करने के लिए किया जा सकता है। डेटाब्रिक्स-डॉली-15k डेटासेट के साथ आता है क्रिएटिव कॉमन्स एट्रिब्यूशन-शेयरअलाइक 3.0 अनपोर्टेड लाइसेंस, जो किसी को भी इसका उपयोग करने, इसे संशोधित करने और इस पर एक व्यावसायिक एप्लिकेशन बनाने की अनुमति देता है।

उन्होंने डेटाब्रिक्स-डॉली-15k डेटासेट कैसे बनाया?

ओपनएआई अनुसंधान काग़ज़ बताता है कि मूल इंस्ट्रक्टजीपीटी मॉडल को 13,000 संकेतों और प्रतिक्रियाओं पर प्रशिक्षित किया गया था। इस जानकारी का उपयोग करके, डेटाब्रिक्स टीम ने इस पर काम करना शुरू किया और यह पता चला कि 13k प्रश्न और उत्तर उत्पन्न करना एक कठिन काम था। वे सिंथेटिक डेटा या एआई जेनरेटिव डेटा का उपयोग नहीं कर सकते हैं, और उन्हें हर प्रश्न का मूल उत्तर तैयार करना होगा। यहीं पर उन्होंने मानव-जनित डेटा बनाने के लिए डेटाब्रिक्स के 5,000 कर्मचारियों का उपयोग करने का निर्णय लिया है।

डेटाब्रिक्स ने एक प्रतियोगिता रखी है, जिसमें शीर्ष 20 लेबलर्स को बड़ा पुरस्कार मिलेगा। इस प्रतियोगिता में 5,000 डेटाब्रिक्स कर्मचारियों ने भाग लिया जो एलएलएम में बहुत रुचि रखते थे

डॉली-वी2-12बी कोई अत्याधुनिक मॉडल नहीं है। यह कुछ मूल्यांकन बेंचमार्क में dolly-v1-6b से कम प्रदर्शन करता है। यह अंतर्निहित फ़ाइन-ट्यूनिंग डेटासेट की संरचना और आकार के कारण हो सकता है। डॉली मॉडल परिवार सक्रिय विकास के अधीन है, इसलिए आप भविष्य में बेहतर प्रदर्शन के साथ एक अद्यतन संस्करण देख सकते हैं।

संक्षेप में, डॉली-v2-12b मॉडल ने EleutherAI/gpt-neox-20b और EleutherAI/pythia-6.9b से बेहतर प्रदर्शन किया है।

डॉली 2.0: वाणिज्यिक उपयोग के लिए चैटजीपीटी ओपन सोर्स वैकल्पिक
से छवि मुफ़्त डॉली

डॉली 2.0 100% ओपन-सोर्स है। यह प्रशिक्षण कोड, डेटासेट, मॉडल भार और अनुमान पाइपलाइन के साथ आता है। सभी घटक व्यावसायिक उपयोग के लिए उपयुक्त हैं। आप हगिंग फेस स्पेस पर मॉडल आज़मा सकते हैं रामअनंत2 द्वारा डॉली वी1.

डॉली 2.0: वाणिज्यिक उपयोग के लिए चैटजीपीटी ओपन सोर्स वैकल्पिक
से छवि गले लगना

संसाधन:

डॉली 2.0 डेमो: रामअनंत2 द्वारा डॉली वी1

आबिद अली अवनी (@1अबिदलियावान) एक प्रमाणित डेटा वैज्ञानिक पेशेवर है जो मशीन लर्निंग मॉडल बनाना पसंद करता है। वर्तमान में, वह सामग्री निर्माण और मशीन लर्निंग और डेटा विज्ञान प्रौद्योगिकियों पर तकनीकी ब्लॉग लिखने पर ध्यान केंद्रित कर रहा है। आबिद के पास प्रौद्योगिकी प्रबंधन में मास्टर डिग्री और दूरसंचार इंजीनियरिंग में स्नातक की डिग्री है। उनका दृष्टिकोण मानसिक बीमारी से जूझ रहे छात्रों के लिए ग्राफ न्यूरल नेटवर्क का उपयोग करके एआई उत्पाद बनाना है।