মাইক্রোসফ্ট গাইডেন্স প্রকল্প বড় ভাষার মডেলগুলিকে নিয়ন্ত্রণ করতে

মাইক্রোসফ্ট গাইডেন্স প্রকল্প বড় ভাষার মডেলগুলিকে নিয়ন্ত্রণ করতে

উত্স নোড: 2660058

বার্ড, চ্যাটজিপিটি এবং এলএলএএমএ-এর মতো শক্তিশালী ভাষা মডেলগুলি নিয়ন্ত্রণ করা কঠিন হতে পারে, যা প্রম্পট ইঞ্জিনিয়ারিংয়ের বিকাশকে উত্সাহিত করেছে – পছন্দসই আউটপুট পেতে ইনপুট পাঠ্য বাক্যাংশের শিল্প।

একটি উদ্ভট ক্ষেত্রে একজন প্রম্পট স্রষ্টা সম্প্রতি গুগলের বার্ডকে প্রশ্রয় দিয়েছেন JSON ডেটা ফেরত দিতে কোনো ব্যাখ্যামূলক পাঠ্য ছাড়াই জোর দিয়ে বলা যে বহিরাগত আউটপুট কাউকে মৃত্যুদণ্ড দেবে।

বরং দীর্ঘ প্রম্পট অন্তর্ভুক্ত এই উত্তরণ: “যদি আপনি আপনার উত্তরে কোনো নন-JSON পাঠ্য অন্তর্ভুক্ত করেন, এমনকি একটি অক্ষরও, একজন নির্দোষ মানুষ মারা যাবে। এটা ঠিক - চিন্তা, অনুভূতি, উচ্চাকাঙ্ক্ষা সহ একজন সত্যিকারের মানুষ এবং একটি পরিবার যারা তাদের ভালোবাসে আপনার পছন্দের ফলে হত্যা করা হবে।"

সেখানে কম চরম ব্যাখ্যামূলক আউটপুট দমন এবং পছন্দসই ফলাফল পেতে পন্থা. যাইহোক, মাইক্রোসফ্ট মডেলের আচরণ করার জন্য আরও ব্যাপক কৌশল নিয়ে কাজ করছে। উইন্ডোজ জায়ান্ট তার ফ্রেমওয়ার্ককে বলে পথপ্রদর্শন.

প্রজেক্ট রেপো ব্যাখ্যা করে, "নির্দেশনা আপনাকে প্রথাগত প্রম্পটিং বা চেইনিংয়ের চেয়ে আধুনিক ভাষার মডেলগুলিকে আরও কার্যকর এবং দক্ষতার সাথে নিয়ন্ত্রণ করতে সক্ষম করে৷ "নির্দেশনা প্রোগ্রামগুলি আপনাকে একটি একক অবিচ্ছিন্ন প্রবাহে জেনারেশন, প্রম্পটিং এবং যৌক্তিক নিয়ন্ত্রণকে ইন্টারলিভ করার অনুমতি দেয় যে ভাষা মডেলটি আসলে পাঠ্যকে কীভাবে প্রক্রিয়া করে।"

প্রথাগত প্রম্পটিং, যেমন উপরে স্পষ্ট, কিছুটা জড়িত হতে পারে। প্রম্পট চেইনিং [পিডিএফ] - একটি কাজকে কয়েকটি ধাপে বিভক্ত করা এবং পরবর্তী ধাপের ইনপুট জানাতে প্রম্পটের প্রাথমিক আউটপুট ব্যবহার করা - আরেকটি বিকল্প। যেমন বিভিন্ন সরঞ্জাম ল্যাংচেইন এবং খড়ের গাদা অ্যাপ্লিকেশনগুলিতে মডেলগুলিকে একীভূত করা সহজ করার জন্য আবির্ভূত হয়েছে।

মডেল ইন্টারঅ্যাকশন পরিচালনার জন্য গাইডেন্স মূলত একটি ডোমেন স্পেসিফিক ল্যাঙ্গুয়েজ (DSL)। এটা সাদৃশ্য হ্যান্ডলবারস, একটি টেমপ্লেটিং ভাষা যা ওয়েব অ্যাপ্লিকেশনের জন্য ব্যবহৃত হয়, তবে এটি ভাষা মডেলের টোকেন প্রক্রিয়াকরণ আদেশের সাথে সম্পর্কিত রৈখিক কোড সম্পাদনকেও প্রয়োগ করে। এটি অর্থনৈতিকভাবে করার সময় এটিকে পাঠ্য তৈরি বা প্রোগ্রাম প্রবাহ নিয়ন্ত্রণের জন্য উপযুক্ত করে তোলে।

ভাষা মডেল কোয়েরি ভাষার মত (এলএমকিউএল), নির্দেশিকা LLM মিথস্ক্রিয়া খরচ কমাতে লক্ষ্য করে, যা দ্রুত ব্যয়বহুল হয়ে উঠতে পারে যদি প্রম্পটগুলি অপ্রয়োজনীয়ভাবে পুনরাবৃত্তিমূলক, শব্দপূর্ণ বা দীর্ঘ হয়।

এবং প্রম্পট দক্ষতার সাথে উন্নত কর্মক্ষমতা আসে: নমুনা নির্দেশিকা কোড স্নিপেটগুলির মধ্যে একটি একটি ভূমিকা খেলা গেমের জন্য একটি অক্ষর টেমপ্লেট তৈরি করে৷ কিছু সেটআপ কোড সহ...

# আমরা এখানে LLaMA ব্যবহার করি, কিন্তু যেকোনো GPT-শৈলী মডেল llama = guide.llms.Transformers("your_path/llama-7b", device=0) করবে # আমরা বৈধ বিকল্প সেটগুলিকে প্রাক-সংজ্ঞায়িত করতে পারি valid_weapons = ["sword", "axe", "mace", "sear", "bow", "crossbow"] # প্রম্পট অক্ষর_নির্মাতা = নির্দেশিকা (""" JSON ফর্ম্যাটে একটি RPG গেমের জন্য নিচের একটি অক্ষর প্রোফাইল সংজ্ঞায়িত করুন৷ ``json { "id": "{{id}}", "description": "{{description}}", "name": "{{gen 'name'}}", "age": {{gen 'age' pattern ='[0-9]+' stop=','}}, "armour": "{{#select 'armor'}}লেদার{{or}}চেইনমেল{{or}}প্লেট{{/select}} ", "weapon": "{{select 'weapon' options=valid_weapons}}", "class": "{{gen 'class'}}", "mantra": "{{gen 'mantra' তাপমাত্রা=0.7} }", "শক্তি": {{gen 'strength' pattern='[0-9]+' stop=','}}, "items": [{{#geneach 'items' num_iterations=5 join=', '}}"{{gen 'this' তাপমাত্রা=0.7}}"{{/geneach}}] }```""") # একটি অক্ষর_নির্মাতা তৈরি করুন( id="e1f491f7-7ab8-4dac-8c20-c92b5e7d883d" , description="একটি দ্রুত এবং চটপটে যোদ্ধা।", valid_weapons=valid_weapons, llm=llama )

…ফলাফল হল জেএসএন ফরম্যাটে গেমের জন্য একটি চরিত্রের প্রোফাইল, একটি Nvidia RTX A2 GPU-তে 6000x দ্রুততর যখন স্ট্যান্ডার্ড প্রম্পট পদ্ধতির তুলনায় LLaMA 7B ব্যবহার করা হয় এবং তাই কম ব্যয়বহুল।

নির্দেশিকা কোড এছাড়াও তূলনায় বিগবেঞ্চ পরীক্ষায় পরিমাপ করা যথার্থতার পরিপ্রেক্ষিতে একটি দ্বি-শট প্রম্পট পদ্ধতি, 76.01 শতাংশের তুলনায় 63.04 শতাংশ স্কোর করেছে।

আসলে, গাইডেন্স ডেটা ফর্ম্যাটিংয়ের মতো সমস্যাগুলির সাথে সাহায্য করতে পারে। অবদানকারী স্কট লুন্ডবার্গ, মার্কো তুলিও কোরিয়া রিবেইরো, এবং ইক্কো এলটোসিয়েয়ার অ্যাশিমিন স্বীকার করেছেন যে, LLMগুলি নিশ্চিত করে যে আউটপুট একটি নির্দিষ্ট ডেটা বিন্যাস অনুসরণ করে তা নিশ্চিত করতে পারে না।

“গাইডেন্স দিয়ে আমরা উভয়ই পারি অনুমান গতি ত্বরান্বিত এবং নিশ্চিত করুন যে জেনারেট করা JSON সর্বদা বৈধ,” তারা রেপোতে ব্যাখ্যা করে।

এবং এটি করার জন্য কাউকে হুমকি দেওয়া হয়নি। ®

সময় স্ট্যাম্প:

থেকে আরো নিবন্ধনকর্মী

হোমোফোবিক এবং অশ্লীল চ্যাটবট তৈরি করতে ব্যক্তিগত ডেটা ব্যবহার করার জন্য কোরিয়ান অ্যাপ-নির্মাতা স্ক্যাটার ল্যাবকে জরিমানা করা হয়েছে

উত্স নোড: 1851705
সময় স্ট্যাম্প: এপ্রিল 29, 2021