รายการทรัพยากรที่ครอบคลุมสำหรับต้นแบบภาษาขนาดใหญ่ - KDnuggets

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

รายการทรัพยากรที่ครอบคลุมสำหรับต้นแบบโมเดลภาษาขนาดใหญ่
รูปภาพที่สร้างด้วย Leonardo.Ai

ในภูมิทัศน์อันกว้างใหญ่ของ AI พลังปฏิวัติได้เกิดขึ้นในรูปแบบของ Large Language Models (LLMS) มันไม่ใช่แค่คำศัพท์ แต่เป็นอนาคตของเรา ความสามารถของพวกเขาในการทำความเข้าใจและสร้างข้อความที่เหมือนมนุษย์ทำให้พวกเขาได้รับความสนใจ และตอนนี้ได้กลายเป็นหนึ่งในงานวิจัยที่ร้อนแรงที่สุด ลองนึกภาพแชทบอทที่สามารถโต้ตอบคุณราวกับว่าคุณกำลังพูดคุยกับเพื่อนๆ หรือจินตนาการถึงระบบการสร้างเนื้อหาที่แยกแยะได้ยากว่าเขียนโดยมนุษย์หรือ AI หากสิ่งต่างๆ เช่นนี้ทำให้คุณสนใจและต้องการเจาะลึกเข้าไปในใจกลางของ LLM มากขึ้น แสดงว่าคุณมาถูกที่แล้ว ฉันได้รวบรวมรายการทรัพยากรที่ครอบคลุมตั้งแต่บทความที่ให้ความรู้ หลักสูตร และที่เก็บ GitHub ไปจนถึงรายงานการวิจัยที่เกี่ยวข้องซึ่งสามารถช่วยให้คุณเข้าใจได้ดีขึ้น เรามาเริ่มต้นการเดินทางที่น่าตื่นตาตื่นใจในโลกของ LLM โดยไม่ชักช้าอีกต่อไป

รายการทรัพยากรที่ครอบคลุมสำหรับต้นแบบโมเดลภาษาขนาดใหญ่
ภาพโดย Polina Tankilevich บน Pexels

1. ความเชี่ยวชาญด้านการเรียนรู้เชิงลึก – Coursera

Link: ความเชี่ยวชาญการเรียนรู้ลึก

รายละเอียด: การเรียนรู้เชิงลึกเป็นกระดูกสันหลังของ LLM หลักสูตรที่ครอบคลุมนี้สอนโดย Andrew Ng ครอบคลุมหัวข้อสำคัญของโครงข่ายประสาทเทียม พื้นฐานของการมองเห็นคอมพิวเตอร์และการประมวลผลภาษาธรรมชาติ และวิธีการจัดโครงสร้างโปรเจ็กต์แมชชีนเลิร์นนิงของคุณ

2. Stanford CS224N: NLP พร้อมการเรียนรู้เชิงลึก – YouTube

Link: Stanford CS224N: NLP พร้อมการเรียนรู้เชิงลึก

รายละเอียด: เป็นขุมทองแห่งความรู้และนำเสนอการวิจัยล้ำสมัยในการเรียนรู้เชิงลึกสำหรับ NLP อย่างละเอียด

3. หลักสูตร HuggingFace Transformers – HuggingFace

Link: หลักสูตร HuggingFace Transformers

รายละเอียด: หลักสูตรนี้สอน NLP โดยใช้ไลบรารีจากระบบนิเวศ HuggingFace ครอบคลุมการทำงานภายในและการใช้งานไลบรารีต่อไปนี้จาก HuggingFace:

หม้อแปลง
โทเค็น
ชุดข้อมูล
เร่งความเร็ว

4. ChatGPT วิศวกรรมพร้อมท์สำหรับนักพัฒนา – Coursera

Link: หลักสูตร ChatGPT พร้อมวิศวกรรม

รายละเอียด: ChatGPT เป็น LLM ที่ได้รับความนิยม และหลักสูตรนี้จะแชร์แนวทางปฏิบัติที่ดีที่สุดและหลักการสำคัญในการเขียนพร้อมท์ที่มีประสิทธิภาพเพื่อสร้างการตอบสนองที่ดียิ่งขึ้น

1. มหาวิทยาลัย LLM - เชื่อมโยงกัน

Link: มหาวิทยาลัย LLM

รายละเอียด: Cohere เสนอหลักสูตรเฉพาะทางสำหรับผู้เชี่ยวชาญด้าน LLM การติดตามแบบต่อเนื่องซึ่งครอบคลุมแง่มุมทางทฤษฎีของ NLP, LLM และสถาปัตยกรรมโดยละเอียด มุ่งเป้าไปที่ผู้เริ่มต้น เส้นทางแบบไม่ต่อเนื่องมีไว้สำหรับผู้มีประสบการณ์ที่สนใจการใช้งานจริงและกรณีการใช้งานของโมเดลที่ทรงพลังเหล่านี้มากกว่าการทำงานภายใน

2. Stanford CS324: โมเดลภาษาขนาดใหญ่ – เว็บไซต์ Stanford

Link: Stanford CS324: โมเดลภาษาขนาดใหญ่

รายละเอียด: หลักสูตรนี้จะเจาะลึกรายละเอียดปลีกย่อยของโมเดลเหล่านี้ คุณจะได้สำรวจพื้นฐาน ทฤษฎี จริยธรรม และแง่มุมเชิงปฏิบัติของแบบจำลองเหล่านี้ ในขณะเดียวกันก็ได้รับประสบการณ์ตรงอีกด้วย

3. Princeton COS597G: การทำความเข้าใจโมเดลภาษาขนาดใหญ่ – ไซต์ Princeton

Link: ทำความเข้าใจกับโมเดลภาษาขนาดใหญ่

รายละเอียด: เป็นหลักสูตรระดับบัณฑิตศึกษาที่มีหลักสูตรที่ครอบคลุม ทำให้เป็นทางเลือกที่ดีเยี่ยมสำหรับการเรียนรู้เชิงลึก คุณจะได้สำรวจพื้นฐานทางเทคนิค ความสามารถ และข้อจำกัดของโมเดลต่างๆ เช่น รุ่น BERT, GPT, T5, โมเดลแบบผสมผสานของผู้เชี่ยวชาญ, โมเดลที่เน้นการดึงข้อมูล ฯลฯ

4. ETH ซูริก: โมเดลภาษาขนาดใหญ่ (LLM) – RycoLab

Link: ETH ซูริก: โมเดลภาษาขนาดใหญ่

รายละเอียด: หลักสูตรที่ออกแบบใหม่นี้นำเสนอการสำรวจ LLM อย่างครอบคลุม เจาะลึกพื้นฐานความน่าจะเป็น การสร้างแบบจำลองโครงข่ายประสาทเทียม กระบวนการฝึกอบรม เทคนิคการปรับขนาด และการอภิปรายเชิงวิพากษ์เกี่ยวกับการรักษาความปลอดภัยและการใช้งานในทางที่ผิดที่อาจเกิดขึ้น

5. Full Stack LLM Bootcamp – เต็มกอง

Link: Bootcamp LLM แบบเต็มสแต็ค

รายละเอียด: หลักสูตรติวเข้ม Full Stack LLM เป็นหลักสูตรที่เกี่ยวข้องกับอุตสาหกรรมซึ่งครอบคลุมหัวข้อต่างๆ เช่น เทคนิคทางวิศวกรรมที่รวดเร็ว พื้นฐาน LLM กลยุทธ์การปรับใช้ และการออกแบบอินเทอร์เฟซผู้ใช้ เพื่อให้มั่นใจว่าผู้เข้าร่วมมีความพร้อมในการสร้างและปรับใช้แอปพลิเคชัน LLM

6. การปรับแต่งโมเดลภาษาขนาดใหญ่ – Coursera

Link: การปรับแต่งโมเดลภาษาขนาดใหญ่อย่างละเอียด

รายละเอียด: การปรับแต่งแบบละเอียดเป็นเทคนิคที่ช่วยให้คุณสามารถปรับ LLM ตามความต้องการเฉพาะของคุณได้ เมื่อจบหลักสูตรนี้ คุณจะเข้าใจว่าเมื่อใดจึงควรใช้การปรับแต่งแบบละเอียด การเตรียมข้อมูลสำหรับการปรับแต่งแบบละเอียด และวิธีการฝึกอบรม LLM ของคุณเกี่ยวกับข้อมูลใหม่และประเมินประสิทธิภาพ

1. ChatGPT กำลังทำอะไร … และทำไมมันถึงใช้งานได้? – สตีเว่น วุลแฟรม

Link: ChatGPT กำลังทำอะไร … และเหตุใดจึงใช้งานได้

รายละเอียด: หนังสือขนาดสั้นเล่มนี้เขียนโดย Steven Wolfram นักวิทยาศาสตร์ชื่อดัง เขากล่าวถึงแง่มุมพื้นฐานของ ChatGPT ต้นกำเนิดของโครงข่ายประสาทเทียม และความก้าวหน้าในหม้อแปลง กลไกความสนใจ และการประมวลผลภาษาธรรมชาติ เป็นการอ่านที่ยอดเยี่ยมสำหรับผู้ที่สนใจสำรวจความสามารถและข้อจำกัดของ LLM

2. การทำความเข้าใจโมเดลภาษาขนาดใหญ่: รายการเรื่องรออ่านที่พลิกโฉม – Sebastian Raschka

Link: การทำความเข้าใจโมเดลภาษาขนาดใหญ่: รายการเรื่องรออ่านที่เปลี่ยนแปลงได้

รายละเอียด: ประกอบด้วยชุดบทความวิจัยที่สำคัญและมีรายการอ่านตามลำดับเวลา เริ่มตั้งแต่บทความในยุคแรกๆ เกี่ยวกับเครือข่ายประสาทที่เกิดซ้ำ (RNN) ไปจนถึงโมเดล BERT ที่ทรงอิทธิพลและอื่นๆ อีกมากมาย เป็นแหล่งข้อมูลอันล้ำค่าสำหรับนักวิจัยและผู้ปฏิบัติงานในการศึกษาวิวัฒนาการของ NLP และ LLM

3. ซีรี่ส์บทความ: โมเดลภาษาขนาดใหญ่ – Jay Alammar

Link: ซีรี่ส์บทความ: โมเดลภาษาขนาดใหญ่

รายละเอียด: บล็อกของ Jay Alammar เป็นแหล่งความรู้สำหรับทุกคนที่กำลังศึกษาโมเดลภาษาขนาดใหญ่ (LLM) และหม้อแปลงไฟฟ้า บล็อกของเขาโดดเด่นด้วยการผสมผสานการแสดงภาพ คำอธิบายที่เข้าใจง่าย และความครอบคลุมของเนื้อหาอย่างครอบคลุม

4. การสร้างแอปพลิเคชัน LLM สำหรับการผลิต – Chip Huyen

Link: การสร้างแอปพลิเคชัน LLM สำหรับการผลิต

รายละเอียด: ในบทความนี้ จะกล่าวถึงความท้าทายของการผลิต LLM โดยให้ข้อมูลเชิงลึกเกี่ยวกับความสามารถในการจัดองค์ประกอบงานและนำเสนอกรณีการใช้งานที่น่าสนใจ ใครก็ตามที่สนใจ LLM ที่ใช้งานได้จริงจะพบว่ามันมีคุณค่ามาก

รายการทรัพยากรที่ครอบคลุมสำหรับต้นแบบโมเดลภาษาขนาดใหญ่
ภาพโดย RealToughCandy.com บน Pexels

1. สุดยอด-LLM ( 9k ⭐ )

Link: สุดยอด-LLM

รายละเอียด: เป็นคอลเลกชันที่รวบรวมเอกสาร กรอบงาน เครื่องมือ หลักสูตร บทช่วยสอน และทรัพยากรที่เน้นไปที่โมเดลภาษาขนาดใหญ่ (LLM) โดยเน้นที่ ChatGPT เป็นพิเศษ

2. LLMsPracticalGuide ( 6.9k ⭐)

Link: คำแนะนำการปฏิบัติสำหรับโมเดลภาษาขนาดใหญ่

รายละเอียด: ช่วยให้ผู้ปฏิบัติงานสำรวจภูมิทัศน์ที่กว้างขวางของ LLM มันขึ้นอยู่กับรายงานการสำรวจหัวข้อ: การควบคุมพลังของ LLM ในทางปฏิบัติ: แบบสำรวจเกี่ยวกับ ChatGPT และอื่นๆ และ นี้ บล็อก

3. LLM แบบสำรวจ ( 6.1k ⭐ )

Link: LLMสำรวจ

รายละเอียด: เป็นการรวบรวมเอกสารการสำรวจและแหล่งข้อมูลตามรายงานหัวข้อ: การสำรวจโมเดลภาษาขนาดใหญ่. นอกจากนี้ยังมีภาพประกอบเกี่ยวกับวิวัฒนาการทางเทคนิคของโมเดลซีรีส์ GPT ตลอดจนกราฟวิวัฒนาการของงานวิจัยที่ดำเนินการเกี่ยวกับ LLaMA

4. กราฟ-LLM ที่ยอดเยี่ยม ( 637 ⭐ )

Link: สุดยอดกราฟ LLM

รายละเอียด: เป็นแหล่งข้อมูลที่มีคุณค่าสำหรับผู้ที่สนใจการผสมผสานระหว่างเทคนิคที่ใช้กราฟกับ LLM โดยเป็นการรวบรวมเอกสารการวิจัย ชุดข้อมูล เกณฑ์มาตรฐาน แบบสำรวจ และเครื่องมือที่เจาะลึกในสาขาที่กำลังเติบโตนี้

5. Langchain ที่ยอดเยี่ยม ( 5.4k ⭐ )

Link: สุดยอด langchain

รายละเอียด: LangChain เป็นเฟรมเวิร์กที่รวดเร็วและมีประสิทธิภาพสำหรับโครงการ LLM และพื้นที่เก็บข้อมูลนี้เป็นศูนย์กลางในการติดตามความคิดริเริ่มและโครงการที่เกี่ยวข้องกับระบบนิเวศของ LangChain

"แบบสำรวจที่สมบูรณ์เกี่ยวกับ ChatGPT ในยุค AIGC” – เป็นจุดเริ่มต้นที่ดีสำหรับผู้เริ่มต้นใน LLM โดยครอบคลุมเทคโนโลยีพื้นฐาน แอปพลิเคชัน และความท้าทายของ ChatGPT อย่างครอบคลุม
"การสำรวจโมเดลภาษาขนาดใหญ่” – ครอบคลุมความก้าวหน้าล่าสุดใน LLM โดยเฉพาะในสี่ประเด็นหลัก ได้แก่ การฝึกอบรมล่วงหน้า การปรับแต่งการปรับตัว การใช้ประโยชน์ และการประเมินขีดความสามารถ
"ความท้าทายและการประยุกต์โมเดลภาษาขนาดใหญ่” – กล่าวถึงความท้าทายของ LLM และขอบเขตการใช้งานที่ประสบความสำเร็จของ LLM
"ความสนใจคือสิ่งที่คุณต้องการ” – Transformers ทำหน้าที่เป็นรากฐานสำหรับ GPT และ LLM อื่นๆ และบทความนี้จะแนะนำสถาปัตยกรรม Transformer
"หม้อแปลงที่มีคำอธิบายประกอบ” – แหล่งข้อมูลจากมหาวิทยาลัยฮาร์วาร์ดที่ให้คำอธิบายโดยละเอียดและคำอธิบายประกอบเกี่ยวกับสถาปัตยกรรม Transformer ซึ่งเป็นพื้นฐานของ LLM หลายแห่ง
"หม้อแปลงไฟฟ้าภาพประกอบ” – คู่มือแบบภาพซึ่งช่วยให้คุณเข้าใจสถาปัตยกรรม Transformer ในเชิงลึก ทำให้เข้าถึงแนวคิดที่ซับซ้อนได้มากขึ้น
"BERT: การฝึกอบรมล่วงหน้าของหม้อแปลงสองทิศทางเชิงลึกเพื่อการทำความเข้าใจภาษา” – บทความนี้จะแนะนำ BERT ซึ่งเป็น LLM ที่มีอิทธิพลอย่างสูงซึ่งกำหนดเกณฑ์มาตรฐานใหม่สำหรับงานการประมวลผลภาษาธรรมชาติ (NLP) จำนวนมาก

ในบทความนี้ ฉันได้รวบรวมรายการทรัพยากรที่จำเป็นสำหรับการเรียนรู้โมเดลภาษาขนาดใหญ่ (LLM) อย่างเชี่ยวชาญ อย่างไรก็ตาม การเรียนรู้เป็นกระบวนการที่ไม่หยุดนิ่ง และการแบ่งปันความรู้ถือเป็นหัวใจสำคัญของการเรียนรู้ หากคุณมีแหล่งข้อมูลเพิ่มเติมในใจและเชื่อว่าควรเป็นส่วนหนึ่งของรายการที่ครอบคลุมนี้ โปรดอย่าลังเลที่จะแบ่งปันในส่วนความคิดเห็น การมีส่วนร่วมของคุณอาจเป็นสิ่งล้ำค่าสำหรับผู้อื่นในเส้นทางการเรียนรู้ของพวกเขา โดยการสร้างพื้นที่โต้ตอบและการทำงานร่วมกันเพื่อเพิ่มพูนความรู้

คันวัล เมเรน เป็นนักพัฒนาซอฟต์แวร์ที่มีความทะเยอทะยานและมีความสนใจอย่างมากในด้านวิทยาศาสตร์ข้อมูลและการประยุกต์ใช้ AI ในทางการแพทย์ Kanwal ได้รับเลือกให้เป็น Google Generation Scholar 2022 สำหรับภูมิภาค APAC Kanwal ชอบแบ่งปันความรู้ด้านเทคนิคโดยการเขียนบทความเกี่ยวกับหัวข้อที่กำลังมาแรง และมีความกระตือรือร้นเกี่ยวกับการปรับปรุงการเป็นตัวแทนของผู้หญิงในอุตสาหกรรมเทคโนโลยี