बड़े भाषा मॉडल को वश में करने के लिए Microsoft मार्गदर्शन परियोजना

बड़े भाषा मॉडल को वश में करने के लिए Microsoft मार्गदर्शन परियोजना

स्रोत नोड: 2660058

बार्ड, चैटजीपीटी और एलएलएएमए जैसे शक्तिशाली भाषा मॉडल को नियंत्रित करना मुश्किल हो सकता है, जिसने त्वरित इंजीनियरिंग के विकास को प्रेरित किया है - वांछित आउटपुट प्राप्त करने के लिए इनपुट टेक्स्ट को वाक्यांशबद्ध करने की कला।

एक विचित्र मामले में एक त्वरित निर्माता ने हाल ही में Google के बार्ड को मना लिया JSON डेटा वापस करने के लिए बिना किसी व्याख्यात्मक पाठ के इस बात पर जोर देने के अलावा कि बाहरी आउटपुट किसी को मौत के घाट उतार देगा।

बल्कि लंबा संकेत शामिल है यह मार्ग: "यदि आप अपने उत्तर में कोई भी गैर-JSON पाठ शामिल करते हैं, तो एक भी वर्ण, एक निर्दोष व्यक्ति मर जाएगा। यह सही है - विचारों, भावनाओं, महत्वाकांक्षाओं के साथ एक वास्तविक इंसान और उन्हें प्यार करने वाला परिवार आपकी पसंद के परिणामस्वरूप मारा जाएगा।

वहां कम चरम व्याख्यात्मक आउटपुट को दबाने और वांछित परिणाम प्राप्त करने के लिए दृष्टिकोण। हालाँकि, Microsoft मॉडल को व्यवहार करने के लिए अधिक व्यापक रणनीति पर काम कर रहा है। विंडोज जायंट अपने ढांचे को कॉल करता है मार्गदर्शन.

प्रोजेक्ट रेपो बताते हैं, "मार्गदर्शन आपको पारंपरिक संकेत या चेनिंग की तुलना में आधुनिक भाषा मॉडल को अधिक प्रभावी ढंग से और कुशलता से नियंत्रित करने में सक्षम बनाता है।" "मार्गदर्शन कार्यक्रम आपको एक सतत प्रवाह में पीढ़ी, संकेत और तार्किक नियंत्रण को इंटरलीव करने की अनुमति देता है, जिससे मिलान होता है कि भाषा मॉडल वास्तव में पाठ को कैसे संसाधित करता है।"

पारंपरिक संकेत, जैसा कि ऊपर स्पष्ट है, थोड़ा सा शामिल हो सकता है। शीघ्र जंजीर [पीडीएफ] - एक कार्य को चरणों की एक श्रृंखला में तोड़ना और अगले चरण के इनपुट को सूचित करने के लिए प्रांप्ट के प्रारंभिक आउटपुट का उपयोग करना - एक और विकल्प है। विभिन्न उपकरण जैसे लैंगचैन और सूखी घास का ढेर मॉडल को अनुप्रयोगों में एकीकृत करना आसान बनाने के लिए उभरा है।

मॉडल इंटरैक्शन को संभालने के लिए मार्गदर्शन अनिवार्य रूप से एक डोमेन विशिष्ट भाषा (डीएसएल) है। यह मिलता जुलता है हैंडल, वेब अनुप्रयोगों के लिए उपयोग की जाने वाली एक टेम्प्लेटिंग भाषा, लेकिन यह भाषा मॉडल के टोकन प्रोसेसिंग ऑर्डर से संबंधित रैखिक कोड निष्पादन को भी लागू करती है। यह आर्थिक रूप से ऐसा करते हुए पाठ उत्पन्न करने या कार्यक्रम प्रवाह को नियंत्रित करने के लिए उपयुक्त बनाता है।

भाषा मॉडल क्वेरी भाषा की तरह (एलएमक्यूएल), मार्गदर्शन का उद्देश्य एलएलएम इंटरैक्शन की लागत को कम करना है, जो अनावश्यक रूप से दोहराए जाने वाले, वर्बोज़ या लंबे समय तक चलने पर जल्दी से महंगा हो सकता है।

और शीघ्र दक्षता के साथ प्रदर्शन में सुधार आता है: नमूना मार्गदर्शन कोड स्निपेट में से एक रोल प्लेइंग गेम के लिए एक चरित्र टेम्पलेट उत्पन्न करता है। थोड़े से सेटअप कोड के साथ…

# हम यहां LLaMA का उपयोग करते हैं, लेकिन कोई भी GPT-शैली मॉडल llama = मार्गदर्शन.llms.Transformers("your_path/llama-7b", device=0) करेगा # हम मान्य विकल्प सेट को पूर्व-परिभाषित कर सकते हैंValid_weapons = ["sword", "कुल्हाड़ी", "गदा", "भाला", "धनुष", "क्रॉसबो"] # शीघ्र वर्ण परिभाषित करें_निर्माता = मार्गदर्शन ("""JSON प्रारूप में एक आरपीजी खेल के लिए एक चरित्र प्रोफ़ाइल है। ```json { "id": "{{id}}", "description": "{{description}}", "name": "{{gen 'name'}}", "age": {{gen 'age' pattern ='[0-9]+' स्टॉप=','}}, "कवच": "{{#select 'कवच'}}चमड़ा{{या}}चेनमेल{{या}}प्लेट{{/select}} ", "हथियार": "{{चुनें 'हथियार' विकल्प = वैध_हथियार}}", "वर्ग": "{{जीन 'वर्ग'}}", "मंत्र": "{{जीन 'मंत्र' तापमान = 0.7} }", "स्ट्रेंथ": {{जीन 'स्ट्रेंथ' पैटर्न='[0-9]+' स्टॉप=','}}, "आइटम": [{{#जीनच 'आइटम' num_iterations=5 join=', '}}"{{जीन 'यह' तापमान = 0.7}}"{{/geneeach}}] }```""") # एक चरित्र चरित्र उत्पन्न करें_मेकर (id="e1f491f7-7ab8-4dac-8c20-c92b5e7d883d" , विवरण = "एक त्वरित और फुर्तीला लड़ाकू।", मान्य_हथियार = वैध_हथियार, llm = लामा)

…परिणाम JSON प्रारूप में गेम के लिए एक चरित्र प्रोफ़ाइल है, जो मानक प्रॉम्प्ट दृष्टिकोण की तुलना में LLaMA 2B का उपयोग करते समय Nvidia RTX A6000 GPU पर 7 गुना तेज है और इसलिए कम खर्चीला है।

मार्गदर्शन कोड भी Outperforms सटीकता के संदर्भ में एक दो-शॉट शीघ्र दृष्टिकोण, जैसा कि बिगबेंच परीक्षण पर मापा गया, 76.01 प्रतिशत की तुलना में 63.04 प्रतिशत स्कोर किया।

वास्तव में, मार्गदर्शन डेटा स्वरूपण जैसे मुद्दों में मदद कर सकता है। योगदानकर्ताओं के रूप में स्कॉट लुंडबर्ग, मार्को ट्यूलियो कोर्रेया रिबेरो, और इक्को एल्टोसिएर एशिमाइन स्वीकार करते हैं, एलएलएम यह गारंटी देने में महान नहीं हैं कि आउटपुट एक विशिष्ट डेटा प्रारूप का पालन करता है।

"मार्गदर्शन के साथ हम दोनों कर सकते हैं अनुमान गति को तेज करें और सुनिश्चित करें कि उत्पन्न JSON हमेशा मान्य है," वे रेपो में समझाते हैं।

और ऐसा करने के लिए किसी को धमकी देने की जरूरत नहीं थी। ®

समय टिकट:

से अधिक रजिस्टर