Running Mixtral 8x7b On Google Colab For Free - KDnuggets

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

Google Colab पर मिक्सट्रल 8x7b मुफ़्त में चला रहा हूँ
लेखक द्वारा छवि

इस पोस्ट में, हम मिक्सट्रल 8x7बी नामक नए अत्याधुनिक ओपन-सोर्स मॉडल का पता लगाएंगे। हम यह भी सीखेंगे कि LLaMA C++ लाइब्रेरी का उपयोग करके इसे कैसे एक्सेस किया जाए और कम कंप्यूटिंग और मेमोरी पर बड़े भाषा मॉडल कैसे चलाए जाएं।

मिक्सट्रल 8x7बी खुले वजन के साथ विशेषज्ञों (एसएमओई) मॉडल का एक उच्च गुणवत्ता वाला विरल मिश्रण है, जो मिस्ट्रल एआई द्वारा बनाया गया है। इसे अपाचे 2.0 के तहत लाइसेंस प्राप्त है और यह 2 गुना तेज अनुमान के साथ अधिकांश बेंचमार्क पर लामा 70 6बी से बेहतर प्रदर्शन करता है। मिक्सट्रल अधिकांश मानक बेंचमार्क पर GPT3.5 से मेल खाता है या उसे मात देता है और लागत/प्रदर्शन के संबंध में सबसे अच्छा ओपन-वेट मॉडल है।

Google Colab पर मिक्सट्रल 8x7b मुफ़्त में चला रहा हूँ
से छवि विशेषज्ञों का मिश्रण

मिक्सट्रल 8x7B डिकोडर-केवल विरल मिश्रण-विशेषज्ञ नेटवर्क का उपयोग करता है। इसमें मापदंडों के 8 समूहों में से एक फीडफॉरवर्ड ब्लॉक का चयन करना शामिल है, जिसमें एक राउटर नेटवर्क प्रत्येक टोकन के लिए इनमें से दो समूहों को चुनता है, उनके आउटपुट को योगात्मक रूप से जोड़ता है। यह विधि लागत और विलंबता का प्रबंधन करते हुए मॉडल के पैरामीटर गिनती को बढ़ाती है, जिससे कुल पैरामीटर 12.9B होने के बावजूद, यह 46.7B मॉडल जितना कुशल हो जाता है।

मिक्सट्रल 8x7B मॉडल 32k टोकन के विस्तृत संदर्भ को संभालने में उत्कृष्ट है और अंग्रेजी, फ्रेंच, इतालवी, जर्मन और स्पेनिश सहित कई भाषाओं का समर्थन करता है। यह कोड जनरेशन में मजबूत प्रदर्शन प्रदर्शित करता है और इसे एमटी-बेंच जैसे बेंचमार्क पर उच्च स्कोर प्राप्त करते हुए एक निर्देश-पालन मॉडल में ठीक किया जा सकता है।

एलएलएएमए.सीपीपी एक सी/सी++ लाइब्रेरी है जो फेसबुक के एलएलएम आर्किटेक्चर पर आधारित बड़े भाषा मॉडल (एलएलएम) के लिए एक उच्च-प्रदर्शन इंटरफ़ेस प्रदान करती है। यह एक हल्का और कुशल पुस्तकालय है जिसका उपयोग पाठ निर्माण, अनुवाद और प्रश्न उत्तर सहित विभिन्न कार्यों के लिए किया जा सकता है। LLaMA.cpp LLaMA, LLaMA 2, Falcon, Alpaca, Mistral 7B, Mixtral 8x7B, और GPT4ALL सहित LLM की एक विस्तृत श्रृंखला का समर्थन करता है। यह सभी ऑपरेटिंग सिस्टम के साथ संगत है और सीपीयू और जीपीयू दोनों पर कार्य कर सकता है।

इस अनुभाग में, हम Colab पर llama.cpp वेब एप्लिकेशन चलाएंगे। कोड की कुछ पंक्तियाँ लिखकर, आप अपने पीसी या Google Colab पर नए अत्याधुनिक मॉडल के प्रदर्शन का अनुभव कर पाएंगे।

Getting Started

सबसे पहले, हम नीचे दिए गए कमांड लाइन का उपयोग करके llama.cpp GitHub रिपॉजिटरी डाउनलोड करेंगे:

!git clone --depth 1 https://github.com/ggerganov/llama.cpp.git

उसके बाद, हम डायरेक्टरी को रिपॉजिटरी में बदल देंगे और `मेक` कमांड का उपयोग करके llama.cpp इंस्टॉल करेंगे। हम CUDA स्थापित के साथ NVidia GPU के लिए llama.cpp स्थापित कर रहे हैं।

%cd llama.cpp

!make LLAMA_CUBLAS=1

मॉडल डाउनलोड करें

हम `.gguf` मॉडल फ़ाइल के उपयुक्त संस्करण का चयन करके मॉडल को हगिंग फेस हब से डाउनलोड कर सकते हैं। विभिन्न संस्करणों पर अधिक जानकारी यहां पाई जा सकती है TheBloke/Mixtral-8x7B-निर्देश-v0.1-GGUF.

Google Colab पर मिक्सट्रल 8x7b मुफ़्त में चला रहा हूँ
से छवि TheBloke/Mixtral-8x7B-निर्देश-v0.1-GGUF

आप मौजूदा निर्देशिका में मॉडल डाउनलोड करने के लिए `wget` कमांड का उपयोग कर सकते हैं।

!wget https://huggingface.co/TheBloke/Mixtral-8x7B-Instruct-v0.1-GGUF/resolve/main/mixtral-8x7b-instruct-v0.1.Q2_K.gguf

LLaMA सर्वर के लिए बाहरी पता

जब हम एलएलएएमए सर्वर चलाते हैं तो यह हमें एक लोकलहोस्ट आईपी देगा जो कोलाब पर हमारे लिए बेकार है। हमें कोलाब कर्नेल प्रॉक्सी पोर्ट का उपयोग करके लोकलहोस्ट प्रॉक्सी से कनेक्शन की आवश्यकता है।

नीचे दिए गए कोड को चलाने के बाद, आपको ग्लोबल हाइपरलिंक मिलेगा। हम बाद में अपने वेबएप तक पहुंचने के लिए इस लिंक का उपयोग करेंगे।

from google.colab.output import eval_js
print(eval_js("google.colab.kernel.proxyPort(6589)"))

https://8fx1nbkv1c8-496ff2e9c6d22116-6589-colab.googleusercontent.com/

सर्वर चला रहा है

LLaMA C++ सर्वर को चलाने के लिए, आपको मॉडल फ़ाइल के स्थान और सही पोर्ट नंबर के साथ सर्वर कमांड प्रदान करना होगा। यह सुनिश्चित करना महत्वपूर्ण है कि पोर्ट नंबर उसी से मेल खाता है जिसे हमने प्रॉक्सी पोर्ट के लिए पिछले चरण में शुरू किया था।

%cd /content/llama.cpp

!./server -m mixtral-8x7b-instruct-v0.1.Q2_K.gguf -ngl 27 -c 2048 --port 6589

Google Colab पर मिक्सट्रल 8x7b मुफ़्त में चला रहा हूँ

पिछले चरण में प्रॉक्सी पोर्ट हाइपरलिंक पर क्लिक करके चैट वेबएप तक पहुंचा जा सकता है क्योंकि सर्वर स्थानीय रूप से नहीं चल रहा है।

एलएलएएमए सी++ वेबएप

इससे पहले कि हम चैटबॉट का उपयोग शुरू करें, हमें इसे अनुकूलित करना होगा। प्रॉम्प्ट अनुभाग में "LLaMA" को अपने मॉडल नाम से बदलें। इसके अतिरिक्त, उत्पन्न प्रतिक्रियाओं के बीच अंतर करने के लिए उपयोगकर्ता नाम और बॉट नाम को संशोधित करें।

Google Colab पर मिक्सट्रल 8x7b मुफ़्त में चला रहा हूँ

नीचे स्क्रॉल करके और चैट सेक्शन में टाइप करके चैट शुरू करें। बेझिझक ऐसे तकनीकी प्रश्न पूछें जिनका अन्य ओपन सोर्स मॉडल ठीक से उत्तर देने में विफल रहे हैं।

Google Colab पर मिक्सट्रल 8x7b मुफ़्त में चला रहा हूँ

यदि आपको ऐप में कोई समस्या आती है, तो आप मेरे Google Colab का उपयोग करके इसे स्वयं चलाने का प्रयास कर सकते हैं: https://colab.research.google.com/drive/1gQ1lpSH-BhbKN-DdBmq5r8-8Rw8q1p9r?usp=sharing

यह ट्यूटोरियल LLaMA C++ लाइब्रेरी का उपयोग करके Google Colab पर उन्नत ओपन-सोर्स मॉडल, Mixtral 8x7b को चलाने के तरीके पर एक व्यापक मार्गदर्शिका प्रदान करता है। अन्य मॉडलों की तुलना में, मिक्सट्रल 8x7बी बेहतर प्रदर्शन और दक्षता प्रदान करता है, जो इसे उन लोगों के लिए एक उत्कृष्ट समाधान बनाता है जो बड़े भाषा मॉडल के साथ प्रयोग करना चाहते हैं लेकिन उनके पास व्यापक कम्प्यूटेशनल संसाधन नहीं हैं। आप इसे अपने लैपटॉप या फ्री क्लाउड कंप्यूट पर आसानी से चला सकते हैं। यह उपयोगकर्ता के अनुकूल है, और आप अपने चैट ऐप को दूसरों के उपयोग और प्रयोग के लिए भी तैनात कर सकते हैं।

मुझे आशा है कि आपको बड़े मॉडल को चलाने का यह सरल समाधान उपयोगी लगा होगा। मैं हमेशा सरल और बेहतर विकल्पों की तलाश में रहता हूं। यदि आपके पास इससे भी बेहतर समाधान है, तो कृपया मुझे बताएं, और मैं अगली बार इसे कवर करूंगा।

आबिद अली अवनी (@1अबिदलियावान) एक प्रमाणित डेटा वैज्ञानिक पेशेवर है जो मशीन लर्निंग मॉडल बनाना पसंद करता है। वर्तमान में, वह सामग्री निर्माण और मशीन लर्निंग और डेटा विज्ञान प्रौद्योगिकियों पर तकनीकी ब्लॉग लिखने पर ध्यान केंद्रित कर रहा है। आबिद के पास प्रौद्योगिकी प्रबंधन में मास्टर डिग्री और दूरसंचार इंजीनियरिंग में स्नातक की डिग्री है। उनका दृष्टिकोण मानसिक बीमारी से जूझ रहे छात्रों के लिए ग्राफ न्यूरल नेटवर्क का उपयोग करके एआई उत्पाद बनाना है।

इस विषय पर अधिक

एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
स्रोत: https://www.kdnuggets.com/running-mixtral-8x7b-on-google-colab-for-free?utm_source=rss&utm_medium=rss&utm_campaign=running-mixtral-8x7b-on-google-colab-for-free

समय टिकट: जनवरी ७,२०२१

समय टिकट: जनवरी 5, 2023

KDnuggets™ समाचार 21:n40, अक्टूबर 20: मशीन लर्निंग और डेटा साइंस के लिए आपको आवश्यक 20 पायथन पैकेज; पोर्टफोलियो प्रोजेक्ट्स के साथ ऐस डेटा साइंस साक्षात्कार

स्रोत क्लस्टर:

केडनगेट्स

स्रोत नोड: 1878426

समय टिकट: अक्टूबर 20, 2021

अमेज़ॅन वेब सेवा वेबिनार: ग्राहक-केंद्रित रणनीति बनाने और व्यावसायिक परिणामों में सुधार करने के लिए डेटा सेट का लाभ उठाएं

स्रोत क्लस्टर:

केडनगेट्स

स्रोत नोड: 1877942

समय टिकट: अक्टूबर 14, 2021

एआई में इस सप्ताह, 7 अगस्त: जेनरेटिव एआई ज्यूपिटर और स्टैक ओवरफ्लो पर आता है • चैटजीपीटी अपडेट - केडीनगेट्स

एआई में इस सप्ताह, 7 अगस्त: जनरेटिव एआई ज्यूपिटर और स्टैक ओवरफ्लो पर आता है • चैटजीपीटी अपडेट - केडीनगेट्स

स्रोत क्लस्टर:

केडनगेट्स

स्रोत नोड: 2811308

समय टिकट: अगस्त 8, 2023

Google Colab पर मिक्सट्रल 8x7b निःशुल्क चला रहा है - KDnuggets

प्लेटो द्वारा पुनर्प्रकाशित

Getting Started

मॉडल डाउनलोड करें

LLaMA सर्वर के लिए बाहरी पता

सर्वर चला रहा है

एलएलएएमए सी++ वेबएप

इस विषय पर अधिक

से अधिक केडनगेट्स

स्नोफ्लेक पर एक स्ट्रीमिंग सेमी-स्ट्रक्चर्ड एनालिटिक्स प्लेटफॉर्म कैसे बनाएं - केडीनगेट्स

KDnuggets News, 8 मार्च: डेटा साइंस चीट शीट के लिए ChatGPT • 2023 के लिए टॉप फ्री डेटा साइंस ऑनलाइन कोर्स

हमारे बारे में

ऊर्ध्वाधर खोज और ऐ

मंच

जुड़े रहें

लेखा