বড় ভাষার মডেলগুলি আয়ত্ত করার জন্য সম্পদের একটি বিস্তৃত তালিকা - KDnuggets

প্লেটো দ্বারা প্রকাশিত

অনুসরণকারী: 0

বড় ভাষার মডেলগুলি আয়ত্ত করার জন্য সম্পদের একটি বিস্তৃত তালিকা
ছবি Leonardo.Ai দিয়ে তৈরি

AI-এর এই বিস্তীর্ণ ল্যান্ডস্কেপে, Large Language Models (LLMS) আকারে একটি বিপ্লবী শক্তির আবির্ভাব হয়েছে। এটা শুধু একটা গুঞ্জন নয়, আমাদের ভবিষ্যৎ। মানুষের মতো পাঠ্য বোঝার এবং তৈরি করার তাদের ক্ষমতা তাদের স্পটলাইটে এনেছে এবং এখন এটি গবেষণার অন্যতম আলোচিত ক্ষেত্র হয়ে উঠেছে। এমন একটি চ্যাটবট কল্পনা করুন যা আপনাকে এমনভাবে প্রতিক্রিয়া জানাতে পারে যেন আপনি আপনার বন্ধুদের সাথে কথা বলছেন বা একটি বিষয়বস্তু তৈরির সিস্টেম কল্পনা করছেন যে এটি একজন মানুষের বা AI দ্বারা লিখিত কিনা তা পার্থক্য করা কঠিন হয়ে পড়ে। যদি এই ধরনের বিষয়গুলি আপনাকে চক্রান্ত করে এবং আপনি LLM-এর হৃদয়ে আরও ডুব দিতে চান, তাহলে আপনি সঠিক জায়গায় আছেন। আমি তথ্যমূলক নিবন্ধ, কোর্স এবং গিটহাব রিপোজিটরি থেকে প্রাসঙ্গিক গবেষণাপত্র পর্যন্ত সম্পদের একটি বিস্তৃত তালিকা সংগ্রহ করেছি যা আপনাকে সেগুলি আরও ভালভাবে বুঝতে সাহায্য করতে পারে। আর দেরি না করে, আসুন LLM-এর জগতে আমাদের বিস্ময়কর যাত্রা শুরু করি।

বড় ভাষার মডেলগুলি আয়ত্ত করার জন্য সম্পদের একটি বিস্তৃত তালিকা
দ্বারা চিত্র পলিনা টানকিলেভিচ পেক্সেলের উপর

1. ডিপ লার্নিং স্পেশালাইজেশন – কোর্সেরা

লিঙ্ক: গভীর শিক্ষা বিশেষায়িতকরণ

বর্ণনা: গভীর শিক্ষা এলএলএম-এর মেরুদণ্ড গঠন করে। অ্যান্ড্রু এনজি দ্বারা শেখানো এই বিস্তৃত কোর্সটি নিউরাল নেটওয়ার্কের প্রয়োজনীয় বিষয়গুলি, কম্পিউটারের দৃষ্টিভঙ্গি এবং প্রাকৃতিক ভাষা প্রক্রিয়াকরণের মূল বিষয়গুলি এবং আপনার মেশিন লার্নিং প্রকল্পগুলিকে কীভাবে গঠন করতে হয় তা কভার করে।

2. স্ট্যানফোর্ড CS224N: ডিপ লার্নিং সহ NLP – YouTube

লিঙ্ক: স্ট্যানফোর্ড CS224N: ডিপ লার্নিং সহ NLP

বর্ণনা: এটি জ্ঞানের সোনার খনি এবং এনএলপির জন্য গভীর শিক্ষার ক্ষেত্রে অত্যাধুনিক গবেষণার একটি পুঙ্খানুপুঙ্খ ভূমিকা প্রদান করে।

3. HuggingFace ট্রান্সফরমার কোর্স - HuggingFace

লিঙ্ক: HuggingFace ট্রান্সফরমার কোর্স

বর্ণনা: এই কোর্সটি HuggingFace ইকোসিস্টেম থেকে লাইব্রেরি ব্যবহার করে NLP শেখায়। এটি HuggingFace থেকে নিম্নলিখিত লাইব্রেরিগুলির ভিতরের কাজ এবং ব্যবহার কভার করে:

ট্রান্সফরমার
টোকেনাইজার
ডেটাসেট
দ্রুততর করা

4. ডেভেলপারদের জন্য চ্যাটজিপিটি প্রম্পট ইঞ্জিনিয়ারিং - কোর্সেরা

লিঙ্ক: ChatGPT প্রম্পট ইঞ্জিনিয়ারিং কোর্স

বর্ণনা: চ্যাটজিপিটি একটি জনপ্রিয় এলএলএম এবং এই কোর্সটি ভাল প্রতিক্রিয়া তৈরির জন্য কার্যকর প্রম্পট লেখার জন্য সেরা অনুশীলন এবং প্রয়োজনীয় নীতিগুলি ভাগ করে।

1. এলএলএম বিশ্ববিদ্যালয় – কোহেরে

লিঙ্ক: এলএলএম বিশ্ববিদ্যালয়

বর্ণনা: কোহেরে এলএলএম মাস্টার করার জন্য একটি বিশেষ কোর্স অফার করে। তাদের অনুক্রমিক ট্র্যাক, যা এনএলপি, এলএলএম-এর তাত্ত্বিক দিকগুলি এবং তাদের স্থাপত্য বিস্তারিতভাবে কভার করে, নতুনদের লক্ষ্য করে। তাদের অ-ক্রমিক পথটি অভিজ্ঞ ব্যক্তিদের জন্য যারা ব্যবহারিক অ্যাপ্লিকেশনগুলিতে বেশি আগ্রহী এবং তাদের অভ্যন্তরীণ কাজের পরিবর্তে এই শক্তিশালী মডেলগুলির ক্ষেত্রে ব্যবহার করে।

2. স্ট্যানফোর্ড CS324: বড় ভাষার মডেল - স্ট্যানফোর্ড সাইট

লিঙ্ক: স্ট্যানফোর্ড CS324: বড় ভাষার মডেল

বর্ণনা: এই কোর্সটি এই মডেলগুলির জটিলতার গভীরে ডুব দেয়। আপনি এই মডেলগুলির মৌলিক, তত্ত্ব, নীতিশাস্ত্র এবং ব্যবহারিক দিকগুলি অন্বেষণ করবেন এবং কিছু অভিজ্ঞতা অর্জন করবেন।

3. প্রিন্সটন COS597G: বড় ভাষার মডেল বোঝা - প্রিন্সটন সাইট

লিঙ্ক: বড় ভাষার মডেল বোঝা

বর্ণনা: এটি একটি স্নাতক-স্তরের কোর্স যা একটি বিস্তৃত পাঠ্যক্রম অফার করে, এটি গভীরভাবে শেখার জন্য একটি চমৎকার পছন্দ করে তোলে। আপনি BERT, GPT, T5 মডেল, বিশেষজ্ঞ মডেলের মিশ্রণ, পুনরুদ্ধার-ভিত্তিক মডেল ইত্যাদির মতো মডেলগুলির প্রযুক্তিগত ভিত্তি, ক্ষমতা এবং সীমাবদ্ধতাগুলি অন্বেষণ করবেন।

4. ETH জুরিখ: বড় ভাষার মডেল (LLMs) - RycoLab

লিঙ্ক: ETH জুরিখ: বড় ভাষার মডেল

বর্ণনা: এই নতুন পরিকল্পিত কোর্সটি এলএলএম-এর একটি বিস্তৃত অনুসন্ধান অফার করে। সম্ভাব্য ভিত্তি, নিউরাল নেটওয়ার্ক মডেলিং, প্রশিক্ষণ প্রক্রিয়া, স্কেলিং কৌশল এবং নিরাপত্তা এবং সম্ভাব্য অপব্যবহারের উপর সমালোচনামূলক আলোচনায় ডুব দিন।

5. সম্পূর্ণ স্ট্যাক এলএলএম বুটক্যাম্প - সম্পূর্ণ স্ট্যাক

লিঙ্ক: ফুল স্ট্যাক এলএলএম বুটক্যাম্প

বর্ণনা: ফুল স্ট্যাক এলএলএম বুট ক্যাম্প হল একটি শিল্প-প্রাসঙ্গিক কোর্স যা প্রম্পট ইঞ্জিনিয়ারিং কৌশল, এলএলএম ফান্ডামেন্টাল, স্থাপনার কৌশল এবং ইউজার ইন্টারফেস ডিজাইনের মতো বিষয়গুলিকে কভার করে, যাতে অংশগ্রহণকারীরা এলএলএম অ্যাপ্লিকেশনগুলি তৈরি এবং স্থাপন করার জন্য ভালভাবে প্রস্তুত থাকে তা নিশ্চিত করে৷

6. ফাইন টিউনিং বড় ভাষার মডেল - কোর্সেরা

লিঙ্ক: ফাইন টিউনিং বড় ভাষার মডেল

বর্ণনা: ফাইন টিউনিং হল এমন একটি কৌশল যা আপনাকে আপনার নির্দিষ্ট প্রয়োজনের সাথে এলএলএমগুলিকে মানিয়ে নিতে দেয়। এই কোর্সটি সম্পূর্ণ করার মাধ্যমে, আপনি বুঝতে পারবেন কখন ফাইনটিউনিং প্রয়োগ করতে হবে, ফাইন-টিউনিংয়ের জন্য ডেটা প্রস্তুতি এবং কীভাবে আপনার এলএলএমকে নতুন ডেটার উপর প্রশিক্ষণ দিতে হবে এবং এর কার্যকারিতা মূল্যায়ন করতে হবে।

1. ChatGPT কি করছে ... এবং কেন এটি কাজ করে? - স্টিভেন উলফ্রাম

লিঙ্ক: চ্যাটজিপিটি কী করছে … এবং কেন এটি কাজ করে?

বর্ণনা: এই ছোট বইটি লিখেছেন বিখ্যাত বিজ্ঞানী স্টিভেন উলফ্রাম। তিনি ChatGPT-এর মৌলিক দিক, নিউরাল জালে এর উৎপত্তি এবং ট্রান্সফরমার, মনোযোগের প্রক্রিয়া এবং প্রাকৃতিক ভাষা প্রক্রিয়াকরণে এর অগ্রগতি নিয়ে আলোচনা করেন। LLM-এর ক্ষমতা এবং সীমাবদ্ধতাগুলি অন্বেষণ করতে আগ্রহী কারও জন্য এটি একটি চমৎকার পঠন।

2. বড় ভাষার মডেলগুলি বোঝা: একটি রূপান্তরমূলক পাঠের তালিকা - সেবাস্টিয়ান রাশকা

লিঙ্ক: বৃহৎ ভাষার মডেল বোঝা: একটি রূপান্তরমূলক পড়ার তালিকা

বর্ণনা: এটিতে গুরুত্বপূর্ণ গবেষণাপত্রের একটি সংগ্রহ রয়েছে এবং এটি একটি কালানুক্রমিক পঠন তালিকা প্রদান করে, পুনরাবৃত্ত নিউরাল নেটওয়ার্ক (RNNs) থেকে শুরু করে প্রভাবশালী BERT মডেল এবং তার পরেও। এটি NLP এবং LLM-এর বিবর্তন অধ্যয়ন করার জন্য গবেষক এবং অনুশীলনকারীদের জন্য একটি অমূল্য সম্পদ।

3. প্রবন্ধ সিরিজ: বড় ভাষার মডেল - জে আলামমার

লিঙ্ক: প্রবন্ধ সিরিজ: বড় ভাষার মডেল

বর্ণনা: জে আলামারের ব্লগ বৃহৎ ভাষার মডেল (এলএলএম) এবং ট্রান্সফরমার অধ্যয়নরত সকলের জন্য জ্ঞানের ভান্ডার। তার ব্লগগুলি তাদের ভিজ্যুয়ালাইজেশনের অনন্য মিশ্রণ, স্বজ্ঞাত ব্যাখ্যা এবং বিষয়বস্তুর ব্যাপক কভারেজের জন্য আলাদা।

4. উৎপাদনের জন্য এলএলএম অ্যাপ্লিকেশন তৈরি করা - চিপ হুয়েন

লিঙ্ক: উৎপাদনের জন্য এলএলএম অ্যাপ্লিকেশন তৈরি করা

বর্ণনা: এই নিবন্ধে, এলএলএম উত্পাদন করার চ্যালেঞ্জগুলি নিয়ে আলোচনা করা হয়েছে। এটি টাস্ক কম্পোজেবিলিটির অন্তর্দৃষ্টি প্রদান করে এবং প্রতিশ্রুতিশীল ব্যবহারের ক্ষেত্রে প্রদর্শন করে। ব্যবহারিক এলএলএম-এ আগ্রহী যে কেউ এটি সত্যিই মূল্যবান বলে মনে করবেন।

বড় ভাষার মডেলগুলি আয়ত্ত করার জন্য সম্পদের একটি বিস্তৃত তালিকা
দ্বারা চিত্র RealToughCandy.com পেক্সেলের উপর

1. Awesome-LLM ( 9k ⭐ )

লিঙ্ক: অসাধারণ-এলএলএম

বর্ণনা: এটি কাগজপত্র, ফ্রেমওয়ার্ক, টুলস, কোর্স, টিউটোরিয়াল এবং সংস্থানগুলির একটি সংকলিত সংগ্রহ যা ChatGPT-এর উপর বিশেষ জোর দিয়ে বড় ভাষা মডেল (LLMs) এর উপর দৃষ্টি নিবদ্ধ করে।

2. LLMs ব্যবহারিক গাইড ( 6.9k ⭐ )

লিঙ্ক: বড় ভাষার মডেলের জন্য ব্যবহারিক নির্দেশিকা

বর্ণনা: এটি অনুশীলনকারীদের এলএলএম-এর বিস্তৃত ল্যান্ডস্কেপ নেভিগেট করতে সহায়তা করে। এটি শীর্ষক সমীক্ষা পত্রের উপর ভিত্তি করে: অনুশীলনে এলএলএম-এর শক্তি ব্যবহার করা: চ্যাটজিপিটি এবং তার বাইরে একটি সমীক্ষা এবং এই ব্লগ।

3. এলএলএমএস সার্ভে ( 6.1k ⭐ )

লিঙ্ক: এলএলএমএস সার্ভে

বর্ণনা: এটি শিরোনামের কাগজের উপর ভিত্তি করে জরিপ কাগজপত্র এবং সংস্থানগুলির একটি সংগ্রহ: বড় ভাষার মডেলের একটি সমীক্ষা. এটিতে GPT-সিরিজ মডেলগুলির প্রযুক্তিগত বিবর্তনের একটি চিত্রের পাশাপাশি LLaMA-তে পরিচালিত গবেষণা কাজের একটি বিবর্তনীয় গ্রাফ রয়েছে।

4. অসাধারণ গ্রাফ-LLM ( 637 ⭐ )

লিঙ্ক: অসাধারণ-গ্রাফ-এলএলএম

বর্ণনা: এলএলএম-এর সাথে গ্রাফ-ভিত্তিক কৌশলগুলির সংযোগে আগ্রহী ব্যক্তিদের জন্য এটি একটি মূল্যবান উৎস। এটি গবেষণামূলক কাগজপত্র, ডেটাসেট, বেঞ্চমার্ক, সমীক্ষা এবং সরঞ্জামগুলির একটি সংগ্রহ সরবরাহ করে যা এই উদীয়মান ক্ষেত্রের সন্ধান করে।

5. অসাধারণ ল্যাংচেইন (5.4k ⭐)

লিঙ্ক: দুর্দান্ত-ল্যাংচেইন

বর্ণনা: LangChain হল LLM প্রকল্পগুলির জন্য দ্রুত এবং দক্ষ কাঠামো এবং এই সংগ্রহস্থল হল LangChain এর ইকোসিস্টেমের সাথে সম্পর্কিত উদ্যোগ এবং প্রকল্পগুলি ট্র্যাক করার কেন্দ্র৷

"AIGC যুগে ChatGPT-এর উপর একটি সম্পূর্ণ সমীক্ষা” – এলএলএম-এ নতুনদের জন্য এটি একটি দুর্দান্ত সূচনা পয়েন্ট। এটি ChatGPT-এর অন্তর্নিহিত প্রযুক্তি, অ্যাপ্লিকেশন এবং চ্যালেঞ্জগুলিকে ব্যাপকভাবে কভার করে।
"বড় ভাষার মডেলের একটি সমীক্ষা” – এটি এলএলএম-এর সাম্প্রতিক অগ্রগতিগুলিকে কভার করে বিশেষ করে প্রাক-প্রশিক্ষণ, অভিযোজন টিউনিং, ব্যবহার এবং ক্ষমতা মূল্যায়নের চারটি প্রধান দিক।
"বড় ভাষার মডেলের চ্যালেঞ্জ এবং প্রয়োগ” – এলএলএমগুলির চ্যালেঞ্জ এবং এলএলএমগুলির সফল প্রয়োগের ক্ষেত্রগুলি নিয়ে আলোচনা করে৷
"মনোযোগ আপনার প্রয়োজন সব” – ট্রান্সফরমারগুলি জিপিটি এবং অন্যান্য এলএলএমগুলির ভিত্তিপ্রস্তর হিসাবে কাজ করে এবং এই কাগজটি ট্রান্সফরমার আর্কিটেকচারের পরিচয় দেয়৷
"টীকা ট্রান্সফরমার” – হার্ভার্ড বিশ্ববিদ্যালয়ের একটি সংস্থান যা ট্রান্সফরমার আর্কিটেকচারের একটি বিশদ এবং টীকাযুক্ত ব্যাখ্যা প্রদান করে, যা অনেক এলএলএম-এর জন্য মৌলিক।
"ইলাস্ট্রেটেড ট্রান্সফরমার” – একটি ভিজ্যুয়াল গাইড যা আপনাকে ট্রান্সফরমার আর্কিটেকচারকে গভীরভাবে বুঝতে সাহায্য করে, জটিল ধারণাগুলিকে আরও অ্যাক্সেসযোগ্য করে তোলে।
"BERT: ভাষা বোঝার জন্য ডিপ বিডেরেশিয়াল ট্রান্সফর্মারগুলির প্রাক প্রশিক্ষণ” – এই কাগজটি BERT-এর পরিচয় দেয়, একটি অত্যন্ত প্রভাবশালী LLM যা অসংখ্য ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (NLP) কাজের জন্য নতুন বেঞ্চমার্ক সেট করে।

এই নিবন্ধে, আমি লার্জ ল্যাঙ্গুয়েজ মডেল (এলএলএম) আয়ত্ত করার জন্য প্রয়োজনীয় সংস্থানগুলির একটি বিস্তৃত তালিকা তৈরি করেছি। যাইহোক, শেখা একটি গতিশীল প্রক্রিয়া, এবং জ্ঞান ভাগাভাগি তার হৃদয়ে। যদি আপনার মনে অতিরিক্ত সংস্থান থাকে যে আপনি বিশ্বাস করেন যে এই বিস্তৃত তালিকার অংশ হওয়া উচিত, অনুগ্রহ করে মন্তব্য বিভাগে সেগুলি ভাগ করতে দ্বিধা করবেন না। আপনার অবদান অন্যদের শেখার যাত্রায় অমূল্য হতে পারে, জ্ঞান সমৃদ্ধির জন্য একটি ইন্টারেক্টিভ এবং সহযোগিতামূলক স্থান তৈরি করে।

কানওয়াল মেহরীন একজন উচ্চাকাঙ্ক্ষী সফ্টওয়্যার ডেভেলপার যিনি ডাটা সায়েন্স এবং মেডিসিনে AI এর অ্যাপ্লিকেশনে গভীর আগ্রহের সাথে। কানওয়াল APAC অঞ্চলের জন্য Google জেনারেশন স্কলার 2022 হিসেবে নির্বাচিত হয়েছেন। কানওয়াল ট্রেন্ডিং বিষয়গুলিতে নিবন্ধ লিখে প্রযুক্তিগত জ্ঞান শেয়ার করতে পছন্দ করেন এবং প্রযুক্তি শিল্পে মহিলাদের প্রতিনিধিত্ব উন্নত করার বিষয়ে উত্সাহী৷