ব্যবসায়িক নেতাদের জন্য ধাপে ধাপে এলএলএম প্রোডাক্ট ডেভেলপমেন্ট

প্লেটো দ্বারা প্রকাশিত

অনুসরণকারী: 0

LLMOps প্রযুক্তি স্ট্যাক

মিডজার্নি দিয়ে তৈরি

বিশ্বের প্রতিটি শিল্প এবং কোণায় এন্টারপ্রাইজগুলি মার্কেট রিসার্চ, গ্রাহক পরিষেবার মতো বিস্তৃত ব্যবসায়িক অ্যাপ্লিকেশনগুলিতে কর্মক্ষমতা বাড়াতে OpenAI-এর ChatGPT, Anthropic's Claude, এবং AI12Lab-এর Jurassic-এর মতো বৃহৎ ভাষা মডেলগুলির (LLM) শক্তিকে একীভূত করতে ছুটে চলেছে। , এবং বিষয়বস্তু প্রজন্ম।

যাইহোক, এন্টারপ্রাইজ স্কেলে একটি এলএলএম অ্যাপ্লিকেশন তৈরি করতে ঐতিহ্যগত মেশিন লার্নিং (এমএল) অ্যাপ্লিকেশন তৈরির চেয়ে আলাদা টুলসেট এবং বোঝার প্রয়োজন। ব্যবসায়িক নেতা এবং নির্বাহী যারা ব্র্যান্ড ভয়েস এবং নির্ভরযোগ্য পরিষেবার গুণমান রক্ষা করতে চান তাদের LLM কীভাবে কাজ করে এবং একটি LLM অ্যাপ্লিকেশান স্ট্যাকের বিভিন্ন সরঞ্জামের সুবিধা এবং অসুবিধাগুলি সম্পর্কে গভীরভাবে বোঝার প্রয়োজন।

এই নিবন্ধে, আমরা আপনাকে উচ্চ-স্তরের কৌশল এবং সরঞ্জামগুলির একটি অপরিহার্য ভূমিকা দেব যা আপনাকে আপনার ব্যবসার জন্য একটি LLM অ্যাপ্লিকেশন তৈরি করতে এবং চালাতে হবে।

ঐতিহ্যগত এমএল ডেভেলপমেন্ট বনাম এলএলএম অ্যাপ্লিকেশন

প্রথাগত মেশিন লার্নিং মডেলগুলি টাস্ক-নির্দিষ্ট ছিল, যার অর্থ আপনাকে প্রতিটি ভিন্ন কাজের জন্য একটি পৃথক মডেল তৈরি করতে হবে। উদাহরণস্বরূপ, আপনি যদি গ্রাহকের অনুভূতি বিশ্লেষণ করতে চান তবে আপনাকে একটি মডেল তৈরি করতে হবে এবং আপনি যদি একটি গ্রাহক সহায়তা চ্যাটবট তৈরি করতে চান তবে আপনাকে অন্য মডেল তৈরি করতে হবে।

টাস্ক-নির্দিষ্ট এমএল মডেল তৈরি এবং প্রশিক্ষণের এই প্রক্রিয়াটি সময়সাপেক্ষ এবং প্রচুর ডেটার প্রয়োজন। এই বিভিন্ন এমএল মডেলগুলিকে প্রশিক্ষণের জন্য প্রয়োজনীয় ডেটাসেটগুলিও কাজের উপর নির্ভর করে পরিবর্তিত হবে। গ্রাহকের অনুভূতি বিশ্লেষণ করার জন্য একটি মডেলকে প্রশিক্ষিত করতে, আপনার গ্রাহক পর্যালোচনাগুলির একটি ডেটাসেট প্রয়োজন যা একটি সংশ্লিষ্ট অনুভূতি (ইতিবাচক, নেতিবাচক, নিরপেক্ষ) দিয়ে লেবেল করা হয়েছে৷ একটি গ্রাহক সহায়তা চ্যাটবট তৈরি করার জন্য একটি মডেলকে প্রশিক্ষণ দিতে, আপনার গ্রাহকদের এবং প্রযুক্তিগত সহায়তার মধ্যে কথোপকথনের একটি ডেটাসেট প্রয়োজন।

বড় ভাষা মডেল এটি পরিবর্তন করেছে. এলএলএমগুলিকে পাঠ্য এবং কোডের একটি বিশাল ডেটাসেটে প্রাক-প্রশিক্ষিত করা হয়, যা তাদেরকে বাক্সের বাইরে বিস্তৃত কাজগুলিতে ভালভাবে সম্পাদন করতে দেয়, যার মধ্যে রয়েছে:

পাঠ্য সংক্ষিপ্তকরণ
কন্টেন্ট সৃষ্টি
অনুবাদ
তথ্য নিষ্কাশন
প্রশ্নের উত্তর
অনুভূতির বিশ্লেষণ
গ্রাহক সমর্থন
বিক্রয় সমর্থন

এলএলএম অ্যাপ্লিকেশন বিকাশের প্রক্রিয়াটিকে চারটি প্রয়োজনীয় ধাপে বিভক্ত করা যেতে পারে:

একটি উপযুক্ত ভিত্তি মডেল চয়ন করুন। এটি একটি মূল উপাদান, আপনার LLM অ্যাপ্লিকেশনের কর্মক্ষমতা নির্ধারণ করে।
প্রয়োজনে মডেলটি কাস্টমাইজ করুন। আপনার নির্দিষ্ট চাহিদা মেটানোর জন্য আপনাকে মডেলটি সূক্ষ্ম-সুর করতে হবে বা অতিরিক্ত জ্ঞান বেস দিয়ে এটি বাড়াতে হবে।
এমএল অবকাঠামো সেট আপ করুন। এতে আপনার অ্যাপ্লিকেশন চালানোর জন্য প্রয়োজনীয় হার্ডওয়্যার এবং সফ্টওয়্যার অন্তর্ভুক্ত রয়েছে (যেমন, সেমিকন্ডাক্টর, চিপস, ক্লাউড হোস্টিং, অনুমান, এবং স্থাপনা)।
অতিরিক্ত সরঞ্জাম দিয়ে আপনার অ্যাপ্লিকেশন বৃদ্ধি করুন. এই টুলগুলি আপনার অ্যাপ্লিকেশনের দক্ষতা, কর্মক্ষমতা এবং নিরাপত্তা উন্নত করতে সাহায্য করতে পারে।

এখন, সংশ্লিষ্ট প্রযুক্তি স্ট্যাকের দিকে নজর দেওয়া যাক।

যদি এই গভীর-শিক্ষামূলক সামগ্রী আপনার জন্য দরকারী, আমাদের AI মেলিং লিস্টে সাবস্ক্রাইব করুন সতর্কতা অবলম্বন করার জন্য যখন আমরা নতুন উপাদান প্রকাশ করি।

উচ্চ-স্তরের এলএলএম অ্যাপ্লিকেশন স্ট্যাক

এলএলএম অ্যাপ্লিকেশনগুলি বিভিন্ন মূল উপাদানগুলির উপরে তৈরি করা হয়, যার মধ্যে রয়েছে:

একটি ভিত্তি মডেল, যা নির্দিষ্ট ব্যবহারের ক্ষেত্রে কাস্টমাইজেশনের প্রয়োজন হতে পারে।
এমএল অবকাঠামো ক্লাউড প্ল্যাটফর্ম বা কোম্পানির নিজস্ব হার্ডওয়্যারের মাধ্যমে পর্যাপ্ত কম্পিউটিং সংস্থানগুলির জন্য।
অতিরিক্ত সরঞ্জাম, যেমন ডাটা পাইপলাইন, ভেক্টর ডাটাবেস, অর্কেস্ট্রেশন টুল, ফাইন-টিউনিং এমএল প্ল্যাটফর্ম, মডেল পারফরম্যান্স মনিটরিং টুল ইত্যাদি।

আমরা আপনাকে সংক্ষিপ্তভাবে এই উপাদানগুলির মধ্য দিয়ে যেতে যাচ্ছি যাতে আপনি একটি LLM অ্যাপ্লিকেশন তৈরি এবং স্থাপন করার জন্য প্রয়োজনীয় টুলকিটটি আরও ভালভাবে বুঝতে পারেন।

ফাউন্ডেশন মডেল কি?

একটি একক প্রাক-প্রশিক্ষিত এলএলএম ব্যবহার করা আপনার অনেক সময় এবং সম্পদ বাঁচাতে পারে। যাইহোক, গ্রাউন্ড আপ থেকে এই ধরনের একটি মডেল প্রশিক্ষণ একটি সময়োপযোগী এবং ব্যয়বহুল প্রক্রিয়া যা কিছু অভিজাত প্রযুক্তি নেতা ছাড়া বেশিরভাগ কোম্পানির ক্ষমতার বাইরে।

বেশ কয়েকটি কোম্পানি এবং গবেষণা দল এই মডেলগুলিকে প্রশিক্ষিত করেছে এবং অন্যান্য কোম্পানিগুলিকে সেগুলি ব্যবহার করার অনুমতি দিয়েছে৷ নেতৃস্থানীয় উদাহরণ ChatGPT, Claude, Llama, Jurassic, এবং T5 অন্তর্ভুক্ত। এই পাবলিক-ফেসিং মডেলগুলিকে ফাউন্ডেশন মডেল বলা হয়। তাদের মধ্যে কিছু মালিকানাধীন এবং একটি ফি দিয়ে API কলের মাধ্যমে অ্যাক্সেস করা যেতে পারে। অন্যগুলো ওপেন সোর্স এবং বিনামূল্যে ব্যবহার করা যেতে পারে। এই মডেলগুলিকে লেবেলবিহীন পাঠ্য ডেটার একটি বিশাল ডেটাসেটে প্রাক-প্রশিক্ষিত করা হয়, যা তাদের সৃজনশীল বিজ্ঞাপনের অনুলিপি তৈরি করা থেকে শুরু করে কোম্পানির পক্ষ থেকে আপনার গ্রাহকদের সাথে তাদের স্থানীয় ভাষায় যোগাযোগ করা পর্যন্ত বিস্তৃত কাজ সম্পাদন করতে সক্ষম করে।

দুটি প্রধান ধরণের ফাউন্ডেশন মডেল রয়েছে: মালিকানাধীন এবং ওপেন সোর্স।

মালিকানাধীন মডেল একটি একক কোম্পানি বা সংস্থার মালিকানাধীন এবং সাধারণত শুধুমাত্র একটি ফি এর জন্য উপলব্ধ। মালিকানাধীন মডেলের সবচেয়ে জনপ্রিয় উদাহরণগুলির মধ্যে রয়েছে OpenAI-এর GPT মডেল, Anthropic-এর Claude মডেল এবং AI21 Labs-এর জুরাসিক মডেল।

ওপেন সোর্স মডেল যারা এগুলি ব্যবহার করতে চায় তাদের জন্য সাধারণত বিনামূল্যে পাওয়া যায়। যাইহোক, কিছু ওপেন-সোর্স মডেলের ব্যবহারে সীমাবদ্ধতা রয়েছে, যেমন: (1) শুধুমাত্র গবেষণার উদ্দেশ্যে উপলব্ধ, (2) শুধুমাত্র একটি নির্দিষ্ট আকারের কোম্পানিগুলির বাণিজ্যিক ব্যবহারের জন্য উপলব্ধ। ওপেন-সোর্স সম্প্রদায় দাবি করে যে এই ধরনের বিধিনিষেধগুলি একটি মডেলকে "ওপেন সোর্স" হিসাবে যোগ্যতা অর্জনের অনুমতি দেয় না। এখনও, ভাষা মডেলগুলির সবচেয়ে বিশিষ্ট উদাহরণ যা বিনামূল্যে ব্যবহার করা যেতে পারে, মেটা দ্বারা লামা মডেল, আবুধাবিতে প্রযুক্তি উদ্ভাবন ইনস্টিটিউটের ফ্যালকন মডেল এবং স্টেবিলিটি এআই-এর স্টেবলএলএম মডেলগুলি অন্তর্ভুক্ত করে। ওপেন সোর্স মডেল এবং সংশ্লিষ্ট ঝুঁকি সম্পর্কে আরও পড়ুন এখানে.

এখন আসুন আপনার এলএলএম অ্যাপ্লিকেশনের জন্য একটি ফাউন্ডেশন মডেল নির্বাচন করার সময় বিবেচনা করার জন্য বেশ কয়েকটি বিষয় নিয়ে আলোচনা করা যাক।

একটি ফাউন্ডেশন মডেল চয়ন করুন

আপনার এলএলএম অ্যাপ্লিকেশনের জন্য সেরা ভিত্তি মডেল নির্বাচন করা একটি চ্যালেঞ্জিং প্রক্রিয়া হতে পারে, তবে আমরা এটিকে মূলত তিনটি ধাপে বিভক্ত করতে পারি:

মালিকানা এবং ওপেন সোর্স মডেলের মধ্যে নির্বাচন করুন। মালিকানাধীন মডেলগুলি সাধারণত ওপেন-সোর্স মডেলের তুলনায় বড় এবং বেশি সক্ষম, তবে সেগুলি ব্যবহার করা আরও ব্যয়বহুল এবং কম নমনীয় হতে পারে। অতিরিক্তভাবে, কোডটি ততটা স্বচ্ছ নয়, যা মালিকানা মডেলের কার্যকারিতা নিয়ে সমস্যাগুলি ডিবাগ করা বা সমস্যা সমাধান করা কঠিন করে তোলে। অন্যদিকে, ওপেন সোর্স মডেলগুলি সাধারণত কম আপডেট এবং ডেভেলপারদের কাছ থেকে কম সমর্থন পায়।
মডেলের আকার চয়ন করুন। বৃহত্তর মডেলগুলি সাধারণত এমন কাজগুলি করতে ভাল হয় যেগুলির জন্য প্রচুর জ্ঞানের প্রয়োজন হয়, যেমন প্রশ্নের উত্তর দেওয়া বা সৃজনশীল পাঠ্য তৈরি করা৷ যাইহোক, বড় মডেলগুলি ব্যবহার করার জন্য গণনাগতভাবে আরও ব্যয়বহুল। আপনি বড় মডেলগুলির সাথে পরীক্ষা করে শুরু করতে পারেন, এবং তারপরে ছোট মডেলগুলিতে যেতে পারেন যতক্ষণ না একটি মডেলের কার্যক্ষমতা আপনার ব্যবহারের ক্ষেত্রে সন্তোষজনক হয়৷
একটি নির্দিষ্ট মডেল নির্বাচন করুন। আপনি পরীক্ষার জন্য মডেলগুলিকে শর্টলিস্ট করতে সাধারণ বেঞ্চমার্কগুলি পর্যালোচনা করে শুরু করতে পারেন। তারপরে, আপনার অ্যাপ্লিকেশন-নির্দিষ্ট অ্যাসাইনমেন্টের জন্য বিভিন্ন মডেল পরীক্ষা করে এগিয়ে যান। কাস্টম বেঞ্চমার্কিংয়ের জন্য, গণনা বিবেচনা করুন BLEU এবং ROUGE স্কোর, মানব-ইন-দ্য-লুপ অ্যাপ্লিকেশনের জন্য আউটপুট প্রকাশ করার আগে AI-উত্পন্ন পাঠ্যের জন্য প্রয়োজনীয় সংশোধনের সংখ্যা নির্ধারণে সাহায্য করে এমন মেট্রিক্স।

বিভিন্ন ভাষার মডেলের মধ্যে পার্থক্য ভালোভাবে বোঝার জন্য, পরীক্ষা করে দেখুন সবচেয়ে শক্তিশালী ভাষা (LLM) এবং ভিজ্যুয়াল ল্যাঙ্গুয়েজ মডেলের (VLM) আমাদের ওভারভিউ.

আপনি আপনার অ্যাপ্লিকেশনের জন্য একটি ভিত্তি মডেল বেছে নেওয়ার পরে, আপনি আরও ভাল কর্মক্ষমতার জন্য মডেলটিকে কাস্টমাইজ করতে হবে কিনা তা বিবেচনা করতে পারেন।

একটি ফাউন্ডেশন মডেল কাস্টমাইজ করুন

কিছু ক্ষেত্রে, আপনি আপনার নির্দিষ্ট ব্যবহারের ক্ষেত্রে আরও ভাল পারফরম্যান্সের জন্য একটি ভিত্তি ভাষার মডেল কাস্টমাইজ করতে চাইতে পারেন। উদাহরণস্বরূপ, আপনি একটি নির্দিষ্ট জন্য অপ্টিমাইজ করতে চাইতে পারেন:

ডোমেইন. আপনি যদি নির্দিষ্ট ডোমেনে কাজ করেন, যেমন আইনি, আর্থিক, বা স্বাস্থ্যসেবা, আপনি এই ডোমেনে মডেলের শব্দভাণ্ডারকে সমৃদ্ধ করতে চাইতে পারেন যাতে এটি শেষ-ব্যবহারকারীর প্রশ্নের আরও ভালভাবে বুঝতে এবং উত্তর দিতে পারে।
কার্য. উদাহরণস্বরূপ, যদি আপনি মডেলটি মার্কেটিং প্রচারাভিযান তৈরি করতে চান তবে আপনি এটিকে ব্র্যান্ডেড মার্কেটিং বিষয়বস্তুর নির্দিষ্ট উদাহরণ প্রদান করতে পারেন। এটি মডেলটিকে আপনার কোম্পানি এবং দর্শকদের জন্য উপযুক্ত নিদর্শন এবং শৈলী শিখতে সাহায্য করবে।
ভয়েস টোন. যদি আপনার ভয়েসের একটি নির্দিষ্ট টোন ব্যবহার করার জন্য মডেলটির প্রয়োজন হয়, তাহলে আপনি একটি ডেটাসেটে মডেলটিকে কাস্টমাইজ করতে পারেন যাতে আপনার টার্গেট ভাষাগত নমুনার উদাহরণ অন্তর্ভুক্ত থাকে।

একটি ভিত্তি ভাষা মডেল কাস্টমাইজ করার তিনটি সম্ভাব্য উপায় আছে:

ফাইন-টিউনিং: মডেলটিকে প্রায় 100-500 রেকর্ডের একটি ডোমেন-নির্দিষ্ট লেবেলযুক্ত ডেটাসেট প্রদান করে। মডেলের ওজন আপডেট করা হয়েছে, যার ফলে এই ডেটাসেট দ্বারা উপস্থাপিত কাজগুলিতে আরও ভাল পারফরম্যান্স হওয়া উচিত।
ডোমেইন অভিযোজন: মডেলটিকে একটি ডোমেন-নির্দিষ্ট লেবেলবিহীন ডেটাসেট প্রদান করে যাতে সংশ্লিষ্ট ডোমেনের ডেটার একটি বড় কর্পাস থাকে। মডেল ওজন এছাড়াও এই ক্ষেত্রে আপডেট করা হয়.
তথ্য আহরণ: ক্লোজড-ডোমেন জ্ঞান সহ ভিত্তি মডেলকে বৃদ্ধি করে। মডেলটিকে পুনরায় প্রশিক্ষিত করা হয় না এবং মডেলের ওজন একই থাকে। যাইহোক, মডেলটিকে প্রাসঙ্গিক ডেটা ধারণকারী ভেক্টর ডাটাবেস থেকে তথ্য পুনরুদ্ধার করার অনুমতি দেওয়া হয়।

প্রথম দুটি পদ্ধতির জন্য মডেলটিকে পুনরায় প্রশিক্ষণের জন্য উল্লেখযোগ্য কম্পিউটিং সংস্থানগুলির প্রয়োজন, যা সাধারণত কাস্টমাইজেশন পরিচালনা করার জন্য উপযুক্ত প্রযুক্তিগত প্রতিভা সহ বড় কোম্পানিগুলির জন্যই সম্ভব। ছোট কোম্পানীগুলি সাধারণত ভেক্টর ডাটাবেসের মাধ্যমে ডোমেন জ্ঞানের সাথে মডেলটিকে বাড়ানোর আরও সাধারণ পদ্ধতি ব্যবহার করে, যা আমরা LLM সরঞ্জামগুলির বিভাগে এই নিবন্ধে পরে বিস্তারিত করব।

এমএল অবকাঠামো সেট আপ করুন

LLMOps ল্যান্ডস্কেপের ML অবকাঠামো উপাদানের মধ্যে রয়েছে ক্লাউড প্ল্যাটফর্ম, কম্পিউটিং হার্ডওয়্যার এবং অন্যান্য সংস্থান যা LLM স্থাপন এবং চালানোর জন্য প্রয়োজন। এই উপাদানটি বিশেষভাবে প্রাসঙ্গিক যদি আপনি একটি ওপেন-সোর্স মডেল ব্যবহার করতে বা আপনার অ্যাপ্লিকেশনের জন্য মডেলটি কাস্টমাইজ করতে চান৷ এই ক্ষেত্রে, প্রয়োজনে মডেলটিকে সূক্ষ্ম-টিউন করতে এবং এটি চালানোর জন্য আপনার উল্লেখযোগ্য কম্পিউটিং সংস্থানগুলির প্রয়োজন হতে পারে।

Google ক্লাউড প্ল্যাটফর্ম, Amazon ওয়েব পরিষেবা এবং Microsoft Azure সহ এলএলএম স্থাপনের জন্য অনেকগুলি ক্লাউড প্ল্যাটফর্ম রয়েছে। এই প্ল্যাটফর্মগুলি বেশ কয়েকটি বৈশিষ্ট্য সরবরাহ করে যা LLM গুলি স্থাপন এবং চালানো সহজ করে তোলে, যার মধ্যে রয়েছে:

প্রাক-প্রশিক্ষিত মডেল যা আপনার নির্দিষ্ট অ্যাপ্লিকেশনের জন্য সূক্ষ্ম-টিউন করা যেতে পারে
পরিচালিত পরিকাঠামো যা অন্তর্নিহিত হার্ডওয়্যার এবং সফ্টওয়্যারের যত্ন নেয়
আপনার এলএলএমগুলি পর্যবেক্ষণ এবং ডিবাগ করার জন্য সরঞ্জাম এবং পরিষেবা

আপনার প্রয়োজনীয় কম্পিউটিং সংস্থানগুলির পরিমাণ আপনার মডেলের আকার এবং জটিলতা, আপনি যে কাজগুলি সম্পাদন করতে চান এবং ব্যবসায়িক কার্যকলাপের স্কেল, যেখানে আপনি এই মডেলটি স্থাপন করতে চান তার উপর নির্ভর করবে।

সরঞ্জাম দিয়ে বৃদ্ধি

অতিরিক্ত এলএলএম সংলগ্ন সরঞ্জামগুলি আপনার এলএলএম অ্যাপ্লিকেশনের কার্যকারিতা আরও উন্নত করতে ব্যবহার করা যেতে পারে।

ডেটা পাইপলাইন

আপনার LLM পণ্যে আপনার ডেটা ব্যবহার করার প্রয়োজন হলে, ডেটা প্রিপ্রসেসিং পাইপলাইন আপনার নতুন প্রযুক্তি স্ট্যাকের একটি অপরিহার্য স্তম্ভ হবে, যেমনটি ঐতিহ্যগত এন্টারপ্রাইজ AI স্ট্যাকের মতো। এই টুলগুলির মধ্যে যেকোনো উৎস থেকে ডেটা ইনজেস্ট করার জন্য সংযোগকারী, একটি ডেটা ট্রান্সফরমেশন লেয়ার এবং ডাউনস্ট্রিম সংযোগকারী অন্তর্ভুক্ত রয়েছে। নেতৃস্থানীয় ডেটা পাইপলাইন প্রদানকারী, যেমন Databricks এবং Snowflake, এবং নতুন প্লেয়ার, যেমন Unstructured, বিকাশকারীদের জন্য প্রাকৃতিক ভাষা ডেটার বড় এবং উচ্চ ভিন্ন ভিন্ন কর্পোরা নির্দেশ করা সহজ করে তোলে (যেমন, হাজার হাজার PDF, পাওয়ারপয়েন্ট উপস্থাপনা, চ্যাট লগ, স্ক্র্যাপ করা HTML, ইত্যাদি) অ্যাক্সেসের একক পয়েন্টে বা এমনকি একটি একক নথিতে যা আরও এলএলএম অ্যাপ্লিকেশন দ্বারা ব্যবহার করা যেতে পারে।

ভেক্টর ডাটাবেস

বড় ভাষার মডেলগুলি একবারে কয়েক হাজার শব্দ প্রক্রিয়াকরণের মধ্যে সীমাবদ্ধ, তাই তারা কার্যকরভাবে বড় নথিগুলিকে নিজেরাই প্রক্রিয়া করতে পারে না। বৃহৎ নথির শক্তিকে কাজে লাগাতে ব্যবসায়িকদের ভেক্টর ডাটাবেস ব্যবহার করতে হবে।

ভেক্টর ডাটাবেস হল স্টোরেজ সিস্টেম যা ডাটা পাইপলাইনের মাধ্যমে প্রাপ্ত বড় নথিগুলিকে পরিচালনাযোগ্য ভেক্টর বা এম্বেডিং-এ রূপান্তরিত করে। এলএলএম অ্যাপ্লিকেশনগুলি তখন সঠিক ভেক্টরগুলি চিহ্নিত করতে এই ডাটাবেসগুলিকে জিজ্ঞাসা করতে পারে, শুধুমাত্র প্রয়োজনীয় তথ্যগুলি বের করে।

বর্তমানে উপলব্ধ সবচেয়ে বিশিষ্ট ভেক্টর ডাটাবেসগুলির মধ্যে কিছু হল পাইনকোন, ক্রোমা এবং ওয়েভিয়েট।

অর্কেস্ট্রেশন টুলস

যখন একজন ব্যবহারকারী আপনার LLM অ্যাপ্লিকেশনে একটি প্রশ্ন জমা দেন, যেমন গ্রাহক পরিষেবার জন্য একটি প্রশ্ন, তখন অ্যাপ্লিকেশনটিকে ভাষা মডেলে এই প্রশ্নটি জমা দেওয়ার আগে প্রম্পটগুলির একটি সিরিজ তৈরি করতে হবে। ভাষা মডেলের চূড়ান্ত অনুরোধ সাধারণত ডেভেলপার দ্বারা হার্ড-কোড করা একটি প্রম্পট টেমপ্লেট, বৈধ আউটপুটগুলির উদাহরণ যাকে কয়েক-শট উদাহরণ বলা হয়, বহিরাগত API থেকে পুনরুদ্ধার করা যেকোন প্রয়োজনীয় তথ্য এবং ভেক্টর ডাটাবেস থেকে পুনরুদ্ধার করা প্রাসঙ্গিক নথিগুলির একটি সেট দ্বারা গঠিত। . LangChain বা LlamaIndex-এর মতো কোম্পানিগুলির অর্কেস্ট্রেশন সরঞ্জামগুলি প্রম্পটগুলি পরিচালনা এবং কার্যকর করার জন্য ব্যবহারের জন্য প্রস্তুত ফ্রেমওয়ার্ক প্রদান করে এই প্রক্রিয়াটিকে প্রবাহিত করতে সহায়তা করতে পারে।

ফাইন-টিউনিং

বিশাল ডেটাসেটে প্রশিক্ষিত বড় ভাষার মডেলগুলি ব্যাকরণগতভাবে সঠিক এবং সাবলীল পাঠ তৈরি করতে পারে। যাইহোক, ওষুধ বা আইনের মতো নির্দিষ্ট কিছু ক্ষেত্রে তাদের যথার্থতার অভাব থাকতে পারে। ডোমেন-নির্দিষ্ট ডেটাসেটগুলিতে এই মডেলগুলিকে সূক্ষ্ম-টিউনিং করা তাদের প্রাসঙ্গিক পাঠ্য তৈরি করার ক্ষমতা বাড়িয়ে সেই অঞ্চলগুলির অনন্য বৈশিষ্ট্যগুলিকে অভ্যন্তরীণ করতে দেয়।

একটি এলএলএম ফাইন-টিউনিং ছোট কোম্পানিগুলির জন্য একটি খরচ-নিবিড় প্রক্রিয়া হতে পারে। যাইহোক, Weights & Biases এবং OctoML এর মত কোম্পানির সমাধানগুলি সুবিন্যস্ত এবং দক্ষ ফাইন-টিউনিংয়ে সাহায্য করতে পারে। এই সমাধানগুলি কোম্পানিগুলিকে তাদের নিজস্ব পরিকাঠামোতে বিনিয়োগ না করেই এলএলএমগুলিকে সূক্ষ্ম সুর করার জন্য একটি প্ল্যাটফর্ম প্রদান করে৷

অন্যান্য সরঞ্জাম

আরও অনেক টুল আছে যেগুলো LLM অ্যাপ্লিকেশন তৈরি এবং চালানোর জন্য উপযোগী হতে পারে। উদাহরণস্বরূপ, আপনি যদি আপনার নির্দিষ্ট ডেটা নমুনাগুলির সাথে মডেলটিকে সূক্ষ্ম-টিউন করতে চান তবে আপনার লেবেলিং সরঞ্জামগুলির প্রয়োজন হতে পারে। আপনি আপনার অ্যাপ্লিকেশনের কার্যকারিতা নিরীক্ষণের জন্য নির্দিষ্ট সরঞ্জামগুলি স্থাপন করতে চাইতে পারেন, কারণ ফাউন্ডেশন মডেলের সামান্য পরিবর্তন বা গ্রাহকদের অনুরোধগুলি প্রম্পটের কার্যকারিতাকে উল্লেখযোগ্যভাবে প্রভাবিত করতে পারে। অবশেষে, এমন সরঞ্জাম রয়েছে যা আপনাকে ঘৃণ্য বিষয়বস্তু, বিপজ্জনক সুপারিশ বা পক্ষপাতের প্রচার এড়াতে সাহায্য করার জন্য মডেল নিরাপত্তা নিরীক্ষণ করে। এই বিভিন্ন সরঞ্জামের প্রয়োজনীয়তা এবং গুরুত্ব আপনার নির্দিষ্ট ব্যবহারের ক্ষেত্রে নির্ভর করবে।

এলএলএম অ্যাপ্লিকেশন ডেভেলপমেন্টের পরবর্তী কী?

এলএলএম প্রোডাক্ট ডেভেলপমেন্টের চারটি ধাপ যা আমরা এখানে আলোচনা করেছি, যেকোন এন্টারপ্রাইজের জেনারেটিভ এআই স্ট্র্যাটেজির একটি অপরিহার্য ভিত্তি যা বৃহৎ ভাষার মডেলগুলিকে কাজে লাগায়। অ-প্রযুক্তিগত ব্যবসায়িক নেতাদের বোঝার জন্য এগুলি গুরুত্বপূর্ণ, এমনকি যদি আপনার কাছে একটি প্রযুক্তিগত দল বিশদ বাস্তবায়ন করে থাকে। আমরা ভবিষ্যতে আরও বিস্তারিত টিউটোরিয়াল প্রকাশ করব কিভাবে মার্কেটপ্লেসে জেনারেটিভ এআই টুলের বিস্তৃত পরিসরের সুবিধা নেওয়া যায়। আপাতত, আপনি পারেন আমাদের নিউজলেটার সদস্যতা সর্বশেষ আপডেট পেতে.

আমরা যখন এর মতো আরও সংক্ষিপ্ত নিবন্ধগুলি প্রকাশ করি তখন আমরা আপনাকে জানাব।