فهرستی جامع از منابع برای تسلط بر مدل های زبان بزرگ - KDnuggets

بازنشر افلاطون

دنبال: 0

فهرستی جامع از منابع برای تسلط بر مدل های زبان بزرگ
تصویر تولید شده با Leonardo.Ai

در این چشم انداز وسیع هوش مصنوعی، یک نیروی انقلابی در قالب مدل های زبان بزرگ (LLMS) ظهور کرد. این فقط یک کلمه کلیدی نیست بلکه آینده ماست. توانایی آنها در درک و تولید متنی شبیه انسان، آنها را در کانون توجه قرار داد و اکنون به یکی از داغ ترین زمینه های تحقیق تبدیل شده است. چت باتی را تصور کنید که می تواند به شما پاسخ دهد به گونه ای که گویی با دوستان خود صحبت می کنید یا سیستم تولید محتوا را تصور می کنید که تشخیص آن توسط یک انسان یا یک هوش مصنوعی دشوار می شود. اگر چیزهایی مانند این شما را مجذوب خود می کند و می خواهید بیشتر در قلب LLM شیرجه بزنید، در جای مناسبی هستید. من فهرست جامعی از منابع از مقالات آموزنده، دوره ها، و مخازن GitHub گرفته تا مقالات تحقیقاتی مرتبط را جمع آوری کرده ام که می تواند به شما در درک بهتر آنها کمک کند. بدون تاخیر بیشتر، بیایید سفر شگفت انگیز خود را در دنیای LLM آغاز کنیم.

فهرستی جامع از منابع برای تسلط بر مدل های زبان بزرگ
تصویر پولینا تانکیلویچ روی Pexels

1. تخصص یادگیری عمیق - دوره آموزشی

ارتباط دادن: تخصص یادگیری عمیق

شرح: یادگیری عمیق ستون فقرات LLM را تشکیل می دهد. این دوره جامع که توسط Andrew Ng تدریس می شود، موضوعات اساسی شبکه های عصبی، اصول بینایی کامپیوتر و پردازش زبان طبیعی و نحوه ساختار پروژه های یادگیری ماشینی را پوشش می دهد.

2. Stanford CS224N: NLP با یادگیری عمیق - YouTube

ارتباط دادن: Stanford CS224N: NLP با یادگیری عمیق

شرح: این معدن طلایی دانش است و مقدمه ای کامل برای تحقیقات پیشرفته در یادگیری عمیق برای NLP فراهم می کند.

3. دوره آموزشی HuggingFace Transformers – HuggingFace

ارتباط دادن: دوره آموزشی HuggingFace Transformers

شرح: این دوره NLP را با استفاده از کتابخانه های اکوسیستم HuggingFace آموزش می دهد. این کار داخلی و استفاده از کتابخانه های زیر را از HuggingFace پوشش می دهد:

ترانسفورماتور
توکن سازها
مجموعه داده ها
شتاب دادن

4. ChatGPT Prompt Engineering for Developers – Coursera

ارتباط دادن: دوره مهندسی سریع ChatGPT

شرح: ChatGPT یک LLM محبوب است و این دوره بهترین شیوه ها و اصول اساسی برای نوشتن دستورات موثر برای تولید پاسخ بهتر را به اشتراک می گذارد.

فهرستی جامع از منابع برای تسلط بر مدل های زبان بزرگ
تصویر تولید شده با Leonardo.Ai

1. دانشگاه LLM - Cohere

ارتباط دادن: دانشگاه LLM

شرح: Cohere یک دوره تخصصی برای تسلط بر LLM ارائه می دهد. مسیر متوالی آنها، که جنبه های نظری NLP، LLMs و معماری آنها را با جزئیات پوشش می دهد، برای مبتدیان هدف قرار می گیرد. مسیر غیر ترتیبی آنها برای افراد باتجربه است که بیشتر به کاربردهای عملی و استفاده از موارد این مدل های قدرتمند علاقه مند هستند تا کار داخلی آنها.

2. Stanford CS324: Large Language Models – Stanford Site

ارتباط دادن: Stanford CS324: مدل های زبان بزرگ

شرح: این دوره عمیق تر به پیچیدگی های این مدل ها می پردازد. شما اصول، تئوری، اخلاقیات و جنبه های عملی این مدل ها را بررسی خواهید کرد و در عین حال تجربه عملی را نیز به دست خواهید آورد.

3. پرینستون COS597G: درک مدل های زبان بزرگ – سایت پرینستون

ارتباط دادن: درک مدل های زبان بزرگ

شرح: این یک دوره در سطح فارغ التحصیل است که یک برنامه درسی جامع ارائه می دهد و آن را به یک انتخاب عالی برای یادگیری عمیق تبدیل می کند. شما مبانی فنی، قابلیت‌ها و محدودیت‌های مدل‌هایی مانند مدل‌های BERT، GPT، T5، مدل‌های ترکیبی از متخصصان، مدل‌های مبتنی بر بازیابی و غیره را بررسی خواهید کرد.

4. ETH Zurich: مدل های زبان بزرگ (LLM) - RycoLab

ارتباط دادن: ETH Zurich: مدل های زبان بزرگ

شرح: این دوره جدید طراحی شده، کاوشی جامع از LLM ها را ارائه می دهد. به مبانی احتمالی، مدل‌سازی شبکه‌های عصبی، فرآیندهای آموزشی، تکنیک‌های مقیاس‌بندی، و بحث‌های مهم در مورد امنیت و سوءاستفاده احتمالی شیرجه بزنید.

5. Full Stack LLM Bootcamp – The Full Stack

ارتباط دادن: بوت کمپ کامل پشته LLM

شرح: بوت کمپ Full Stack LLM یک دوره آموزشی مرتبط با صنعت است که موضوعاتی مانند تکنیک های مهندسی سریع، اصول LLM، استراتژی های استقرار و طراحی رابط کاربری را پوشش می دهد و اطمینان حاصل می کند که شرکت کنندگان به خوبی برای ساخت و استقرار برنامه های LLM آماده هستند.

6. تنظیم دقیق مدل های زبان بزرگ - Coursera

ارتباط دادن: تنظیم دقیق مدل های زبان بزرگ

شرح: تنظیم دقیق تکنیکی است که به شما امکان می دهد LLM را با نیازهای خاص خود تطبیق دهید. با تکمیل این دوره، متوجه خواهید شد که چه زمانی باید تنظیمات دقیق، آماده سازی داده ها برای تنظیم دقیق، و نحوه آموزش LLM خود را بر روی داده های جدید و ارزیابی عملکرد آن انجام دهید.

فهرستی جامع از منابع برای تسلط بر مدل های زبان بزرگ
تصویر تولید شده با Leonardo.Ai

1. ChatGPT چه کاری انجام می دهد ... و چرا کار می کند؟ - استیون ولفرام

ارتباط دادن: ChatGPT چه کاری انجام می دهد ... و چرا کار می کند؟

شرح: این کتاب کوتاه توسط استیون ولفرام، دانشمند مشهور نوشته شده است. او جنبه‌های اساسی ChatGPT، ریشه‌های آن در شبکه‌های عصبی، و پیشرفت‌های آن در ترانسفورماتورها، مکانیسم‌های توجه و پردازش زبان طبیعی را مورد بحث قرار می‌دهد. برای افرادی که علاقه مند به بررسی قابلیت ها و محدودیت های LLM هستند، خواندنی عالی است.

2. درک مدل‌های زبان بزرگ: فهرست خواندنی متحول کننده - سباستین راشکا

ارتباط دادن: درک مدل‌های زبان بزرگ: فهرست خواندنی دگرگون‌کننده

شرح: این شامل مجموعه‌ای از مقالات تحقیقاتی مهم است و فهرستی از مطالعه زمانی ارائه می‌کند، از مقالات اولیه در مورد شبکه‌های عصبی مکرر (RNN) تا مدل تاثیرگذار BERT و فراتر از آن. این یک منبع ارزشمند برای محققان و پزشکان برای مطالعه تکامل NLP و LLM است.

3. سری مقاله: مدل های زبان بزرگ – جی آلمار

ارتباط دادن: سری مقاله: مدل های زبان بزرگ

شرح: وبلاگ های جی آلمار گنجینه ای از دانش برای هر کسی است که مدل های زبان بزرگ (LLM) و ترانسفورماتورها را مطالعه می کند. وبلاگ های او به دلیل ترکیب منحصر به فرد خود از تجسم ها، توضیحات شهودی، و پوشش جامع از موضوع برجسته هستند.

4. ساخت برنامه های LLM برای تولید - Chip Huyen

ارتباط دادن: ساخت برنامه های LLM برای تولید

شرح: در این مقاله، چالش های تولید LLM مورد بحث قرار می گیرد. بینش هایی را در مورد قابلیت ترکیب کار ارائه می دهد و موارد استفاده امیدوارکننده را به نمایش می گذارد. هر کسی که علاقه مند به LLM عملی باشد، آن را واقعا ارزشمند خواهد یافت.

فهرستی جامع از منابع برای تسلط بر مدل های زبان بزرگ
تصویر RealToughCandy.com روی Pexels

1. Awesome-LLM (9k ⭐)

ارتباط دادن: عالی-LLM

شرح: این مجموعه‌ای از مقالات، چارچوب‌ها، ابزارها، دوره‌ها، آموزش‌ها و منابعی است که بر روی مدل‌های زبان بزرگ (LLM) متمرکز شده‌اند، با تأکید خاصی بر ChatGPT.

2. LLMsPracticalGuide (6.9k ⭐)

ارتباط دادن: راهنمای عملی برای مدل های زبان بزرگ

شرح: این به تمرین‌کنندگان کمک می‌کند تا در چشم‌انداز گسترده LLM حرکت کنند. بر اساس مقاله نظرسنجی با عنوان: استفاده از قدرت LLM در عمل: نظرسنجی در ChatGPT و فراتر از آن و این وبلاگ.

3. LLMS Survey (6.1k ⭐)

ارتباط دادن: LLMS Survey

شرح: این مجموعه ای از مقالات و منابع نظرسنجی بر اساس مقاله با عنوان: بررسی مدل های زبان بزرگ. همچنین شامل تصویری از تکامل فنی مدل‌های سری GPT و همچنین یک نمودار تکاملی از کار تحقیقاتی انجام شده در LLaMA است.

4. Awesome Graph-LLM (637 ⭐)

ارتباط دادن: Awesome-Graph-LLM

شرح: این یک منبع ارزشمند برای افرادی است که علاقه مند به تلاقی تکنیک های مبتنی بر نمودار با LLM هستند. مجموعه‌ای از مقالات تحقیقاتی، مجموعه داده‌ها، معیارها، نظرسنجی‌ها و ابزارهایی را ارائه می‌کند که در این زمینه نوظهور تحقیق می‌کنند.

5. Langchain عالی (5.4k ⭐)

ارتباط دادن: awesome-langchain

شرح: LangChain چارچوبی سریع و کارآمد برای پروژه‌های LLM است و این مخزن مرکزی برای ردیابی ابتکارات و پروژه‌های مرتبط با اکوسیستم LangChain است.

"یک نظرسنجی کامل در مورد ChatGPT در عصر AIGC” – این یک نقطه شروع عالی برای مبتدیان در LLM است. این به طور جامع فناوری، برنامه‌ها و چالش‌های ChatGPT را پوشش می‌دهد.
"بررسی مدل های زبان بزرگ- پیشرفت های اخیر در LLM را به طور خاص در چهار جنبه اصلی پیش آموزش، تنظیم سازگاری، استفاده و ارزیابی ظرفیت پوشش می دهد.
"چالش ها و کاربردهای مدل های زبان بزرگ” – در مورد چالش های LLM و زمینه های کاربردی موفق LLM بحث می کند.
"توجه تنها چیزی است که نیاز دارید– ترانسفورماتورها به عنوان سنگ بنای GPT و سایر LLM ها عمل می کنند و این مقاله معماری ترانسفورماتور را معرفی می کند.
"ترانسفورماتور مشروح” – منبعی از دانشگاه هاروارد که توضیح مفصل و مشروح شده ای از معماری ترانسفورماتور ارائه می دهد که برای بسیاری از LLM ها اساسی است.
"ترانسفورماتور مصور” – راهنمای بصری که به شما کمک می کند معماری Transformer را عمیقاً درک کنید و مفاهیم پیچیده را در دسترس تر می کند.
"BERT: پیش آموزش ترانسفورماتورهای دو جهته عمیق برای درک زبان– این مقاله BERT را معرفی می کند، یک LLM بسیار تاثیرگذار که معیارهای جدیدی را برای وظایف متعدد پردازش زبان طبیعی (NLP) تعیین می کند.

در این مقاله، من فهرست گسترده ای از منابع ضروری برای تسلط بر مدل های زبان بزرگ (LLM) را تهیه کرده ام. با این حال، یادگیری یک فرآیند پویا است و اشتراک دانش در قلب آن قرار دارد. اگر منابع دیگری در ذهن دارید که فکر می‌کنید باید بخشی از این فهرست جامع باشد، لطفاً از اشتراک‌گذاری آنها در بخش نظرات دریغ نکنید. کمک های شما می تواند برای دیگران در سفر یادگیری آنها ارزشمند باشد و فضایی تعاملی و مشارکتی برای غنی سازی دانش ایجاد کند.

کانوال مهرین یک توسعه دهنده نرم افزار مشتاق با علاقه شدید به علم داده و کاربردهای هوش مصنوعی در پزشکی است. Kanwal به عنوان Google Generation Scholar 2022 برای منطقه APAC انتخاب شد. کانوال دوست دارد دانش فنی را با نوشتن مقالاتی در مورد موضوعات پرطرفدار به اشتراک بگذارد و علاقه زیادی به بهبود نمایندگی زنان در صنعت فناوری دارد.