Danh sách đầy đủ các tài nguyên để làm chủ các mô hình ngôn ngữ lớn - KDnuggets

Được xuất bản lại bởi Plato

Người theo dõi: 0

Danh sách tài nguyên toàn diện để làm chủ các mô hình ngôn ngữ lớn
Hình ảnh được tạo bằng Leonardo.Ai

Trong bối cảnh AI rộng lớn này, một lực lượng cách mạng đã xuất hiện dưới dạng Mô hình ngôn ngữ lớn (LLMS). Nó không chỉ là một từ thông dụng mà còn là tương lai của chúng ta. Khả năng hiểu và tạo ra văn bản giống con người đã đưa chúng trở thành tâm điểm chú ý và giờ đây nó đã trở thành một trong những lĩnh vực nghiên cứu hấp dẫn nhất. Hãy tưởng tượng một chatbot có thể trả lời bạn như thể bạn đang nói chuyện với bạn bè hoặc hình dung ra một hệ thống tạo nội dung mà việc phân biệt nó được viết bởi con người hay AI trở nên khó khăn. Nếu những điều như thế này khiến bạn tò mò và muốn tìm hiểu sâu hơn về LLM thì bạn đã đến đúng nơi. Tôi đã tập hợp một danh sách đầy đủ các tài nguyên, từ các bài viết, khóa học và kho lưu trữ GitHub đầy thông tin cho đến các tài liệu nghiên cứu có liên quan có thể giúp bạn hiểu chúng tốt hơn. Không còn chần chừ gì nữa, hãy bắt đầu cuộc hành trình tuyệt vời của chúng ta trong thế giới LLM.

Danh sách tài nguyên toàn diện để làm chủ các mô hình ngôn ngữ lớn
Hình ảnh của Polina Tankilevitch trên Pexels

1. Chuyên ngành học sâu – Coursera

Link: Chuyên sâu

Sự miêu tả: Học sâu tạo thành xương sống của LLM. Khóa học toàn diện này do Andrew Ng giảng dạy bao gồm các chủ đề thiết yếu về mạng lưới thần kinh, các khái niệm cơ bản về Thị giác máy tính và Xử lý ngôn ngữ tự nhiên cũng như cách cấu trúc các dự án học máy của bạn.

2. Stanford CS224N: NLP với Học sâu - YouTube

Link: Stanford CS224N: NLP với học sâu

Sự miêu tả: Nó là một mỏ vàng kiến thức và cung cấp phần giới thiệu kỹ lưỡng về nghiên cứu tiên tiến về học sâu cho NLP.

3. Khóa học HuggingFace Transformers – HuggingFace

Link: Khóa học ôm mặt Transformers

Sự miêu tả: Khóa học này dạy NLP bằng cách sử dụng các thư viện từ hệ sinh thái HuggingFace. Nó bao gồm hoạt động bên trong và cách sử dụng các thư viện sau từ HuggingFace:

Máy biến áp
Mã thông báo
Bộ dữ liệu
Tăng tốc

4. Kỹ thuật nhắc nhở ChatGPT dành cho nhà phát triển – Coursera

Link: Khóa học kỹ thuật nhắc nhở ChatGPT

Sự miêu tả: ChatGPT là một LLM phổ biến và khóa học này chia sẻ các phương pháp hay nhất cũng như các nguyên tắc thiết yếu để viết lời nhắc hiệu quả nhằm tạo ra phản hồi tốt hơn.

Danh sách tài nguyên toàn diện để làm chủ các mô hình ngôn ngữ lớn
Hình ảnh được tạo bằng Leonardo.Ai

1. Đại học LLM – Cohere

Link: Đại học LLM

Sự miêu tả: Cohere cung cấp một khóa học chuyên biệt để thành thạo LLM. Theo dõi tuần tự của họ, bao gồm các khía cạnh lý thuyết của NLP, LLM và kiến trúc của chúng một cách chi tiết, nhắm đến người mới bắt đầu. Con đường không tuần tự của họ dành cho những cá nhân có kinh nghiệm quan tâm nhiều hơn đến các ứng dụng thực tế và trường hợp sử dụng của những mô hình mạnh mẽ này hơn là hoạt động nội bộ của họ.

2. Stanford CS324: Mô hình ngôn ngữ lớn - Trang Stanford

Link: Stanford CS324: Mô hình ngôn ngữ lớn

Sự miêu tả: Khóa học này đi sâu hơn vào sự phức tạp của các mô hình này. Bạn sẽ khám phá các nguyên tắc cơ bản, lý thuyết, đạo đức và các khía cạnh thực tế của những mô hình này đồng thời tích lũy được một số kinh nghiệm thực hành.

3. Princeton COS597G: Tìm hiểu các mô hình ngôn ngữ lớn - Trang web Princeton

Link: Hiểu các mô hình ngôn ngữ lớn

Sự miêu tả: Đây là khóa học cấp độ sau đại học cung cấp chương trình giảng dạy toàn diện, khiến nó trở thành một lựa chọn tuyệt vời để học chuyên sâu. Bạn sẽ khám phá nền tảng kỹ thuật, khả năng và hạn chế của các mô hình như mô hình BERT, GPT, T5, mô hình hỗn hợp chuyên gia, mô hình dựa trên truy xuất, v.v.

4. ETH Zurich: Mô hình ngôn ngữ lớn (LLM) – RycoLab

Link: ETH Zurich: Mô hình ngôn ngữ lớn

Sự miêu tả: Khóa học được thiết kế mới này cung cấp sự khám phá toàn diện về LLM. Đi sâu vào các nền tảng xác suất, mô hình mạng lưới thần kinh, quy trình đào tạo, kỹ thuật mở rộng quy mô và các cuộc thảo luận quan trọng về bảo mật và khả năng sử dụng sai mục đích.

5. Full Stack LLM Bootcamp – Full Stack

Link: Chương trình đào tạo LLM đầy đủ

Sự miêu tả: Chương trình đào tạo Full Stack LLM là một khóa học phù hợp với ngành bao gồm các chủ đề như kỹ thuật kỹ thuật nhanh chóng, nguyên tắc cơ bản về LLM, chiến lược triển khai và thiết kế giao diện người dùng, đảm bảo người tham gia được chuẩn bị tốt để xây dựng và triển khai các ứng dụng LLM.

6. Tinh chỉnh các mô hình ngôn ngữ lớn – Coursera

Link: Tinh chỉnh các mô hình ngôn ngữ lớn

Sự miêu tả: Tinh chỉnh là kỹ thuật cho phép bạn điều chỉnh LLM theo nhu cầu cụ thể của mình. Khi hoàn thành khóa học này, bạn sẽ hiểu khi nào nên áp dụng tinh chỉnh, chuẩn bị dữ liệu cho tinh chỉnh và cách đào tạo LLM của bạn về dữ liệu mới cũng như đánh giá hiệu suất của nó.

Danh sách tài nguyên toàn diện để làm chủ các mô hình ngôn ngữ lớn
Hình ảnh được tạo bằng Leonardo.Ai

1. ChatGPT đang làm gì… và tại sao nó hoạt động? – Steven Wolfram

Link: ChatGPT đang làm gì… và tại sao nó hoạt động?

Sự miêu tả: Cuốn sách ngắn này được viết bởi Steven Wolfram, một nhà khoa học nổi tiếng. Ông thảo luận về các khía cạnh cơ bản của ChatGPT, nguồn gốc của nó trong mạng lưới thần kinh và những tiến bộ của nó trong máy biến áp, cơ chế chú ý và xử lý ngôn ngữ tự nhiên. Đây là một bài đọc tuyệt vời dành cho những người quan tâm đến việc khám phá các khả năng và hạn chế của LLM.

2. Tìm hiểu các mô hình ngôn ngữ lớn: Danh sách đọc có tính biến đổi – Sebastian Raschka

Link: Hiểu các mô hình ngôn ngữ lớn: Danh sách đọc có tính biến đổi

Sự miêu tả: Nó chứa một tập hợp các tài liệu nghiên cứu quan trọng và cung cấp danh sách đọc theo trình tự thời gian, bắt đầu từ các bài báo đầu tiên về mạng thần kinh tái phát (RNN) cho đến mô hình BERT có ảnh hưởng và hơn thế nữa. Đây là nguồn tài nguyên vô giá cho các nhà nghiên cứu và học viên nghiên cứu sự phát triển của NLP và LLM.

3. Chuỗi bài viết: Mô hình ngôn ngữ lớn – Jay Alammar

Link: Chuỗi bài viết: Mô hình ngôn ngữ lớn

Sự miêu tả: Blog của Jay Alammar là một kho tàng kiến thức dành cho bất kỳ ai nghiên cứu các mô hình ngôn ngữ lớn (LLM) và máy biến áp. Các blog của anh nổi bật nhờ sự kết hợp độc đáo giữa hình ảnh trực quan, cách giải thích trực quan và mức độ bao quát toàn diện về chủ đề.

4. Xây dựng ứng dụng LLM cho sản xuất – Chip Huyền

Link: Xây dựng ứng dụng LLM cho sản xuất

Sự miêu tả: Trong bài viết này, những thách thức trong việc sản xuất LLM sẽ được thảo luận. Nó cung cấp những hiểu biết sâu sắc về khả năng kết hợp nhiệm vụ và giới thiệu các trường hợp sử dụng đầy hứa hẹn. Bất kỳ ai quan tâm đến LLM thực tế sẽ thấy nó thực sự có giá trị.

Danh sách tài nguyên toàn diện để làm chủ các mô hình ngôn ngữ lớn
Hình ảnh của RealToughCandy.com trên Pexels

1. Tuyệt vời-LLM ( 9k ⭐ )

Link: Tuyệt vời-LLM

Sự miêu tả: Đây là một bộ sưu tập các bài báo, khuôn khổ, công cụ, khóa học, hướng dẫn và tài nguyên được tuyển chọn tập trung vào các mô hình ngôn ngữ lớn (LLM), đặc biệt nhấn mạnh vào ChatGPT.

2. Hướng dẫn thực hành LLMs ( 6.9k ⭐ )

Link: Hướng dẫn thực hành cho các mô hình ngôn ngữ lớn

Sự miêu tả: Nó giúp những người thực hành điều hướng bối cảnh mở rộng của LLM. Nó dựa trên bài khảo sát có tiêu đề: Khai thác sức mạnh của LLM trong thực tế: Khảo sát về ChatGPT và hơn thế nữa và điều này blog.

3. Khảo sát LLMS ( 6.1k ⭐ )

Link: LLMSkhảo sát

Sự miêu tả: Đây là một tập hợp các tài liệu khảo sát và tài nguyên dựa trên bài báo có tiêu đề: Khảo sát các mô hình ngôn ngữ lớn. Nó cũng chứa hình minh họa về sự phát triển kỹ thuật của các mô hình dòng GPT cũng như biểu đồ tiến hóa của công việc nghiên cứu được thực hiện trên LLaMA.

4. Đồ thị-LLM tuyệt vời ( 637 ⭐ )

Link: Tuyệt vời-Graph-LLM

Sự miêu tả: Đây là một nguồn có giá trị cho những người quan tâm đến sự giao thoa giữa các kỹ thuật dựa trên đồ thị với LLM. nó cung cấp một bộ sưu tập các tài liệu nghiên cứu, bộ dữ liệu, điểm chuẩn, khảo sát và các công cụ đi sâu vào lĩnh vực mới nổi này.

5. Langchain tuyệt vời ( 5.4k ⭐ )

Link: tuyệt vời-langchain

Sự miêu tả: LangChain là khuôn khổ nhanh chóng và hiệu quả cho các dự án LLM và kho lưu trữ này là trung tâm theo dõi các sáng kiến và dự án liên quan đến hệ sinh thái của LangChain.

"Khảo sát đầy đủ về ChatGPT trong Kỷ nguyên AIGC” – Đó là điểm khởi đầu tuyệt vời cho những người mới bắt đầu học LLM. Nó bao gồm một cách toàn diện về công nghệ, ứng dụng và thách thức cơ bản của ChatGPT.
"Khảo sát các mô hình ngôn ngữ lớn” – Nó đề cập đến những tiến bộ gần đây trong LLM, đặc biệt ở bốn khía cạnh chính là đào tạo trước, điều chỉnh thích ứng, sử dụng và đánh giá năng lực.
"Những thách thức và ứng dụng của các mô hình ngôn ngữ lớn” – Thảo luận về những thách thức của LLM và các lĩnh vực ứng dụng thành công của LLM.
"Chú ý là tất cả những gì bạn cần” – Máy biến áp đóng vai trò là nền tảng cho GPT và các LLM khác và bài viết này giới thiệu về kiến trúc Máy biến áp.
"Máy biến áp được chú thích” – Một tài nguyên từ Đại học Harvard cung cấp giải thích chi tiết và có chú thích về kiến trúc Transformer, nền tảng của nhiều LLM.
"Máy biến áp được minh họa” – Hướng dẫn trực quan giúp bạn hiểu sâu hơn về kiến trúc Transformer, giúp bạn dễ dàng tiếp cận các khái niệm phức tạp hơn.
"BERT: Đào tạo trước về Máy biến áp hai chiều sâu để hiểu ngôn ngữ” – Bài viết này giới thiệu BERT, một LLM có ảnh hưởng lớn, đặt ra các tiêu chuẩn mới cho nhiều nhiệm vụ Xử lý ngôn ngữ tự nhiên (NLP).

Trong bài viết này, tôi đã tuyển chọn một danh sách phong phú các tài nguyên cần thiết để thành thạo Mô hình ngôn ngữ lớn (LLM). Tuy nhiên, học tập là một quá trình năng động và việc chia sẻ kiến thức là cốt lõi của nó. Nếu bạn nghĩ đến các tài nguyên bổ sung mà bạn tin rằng nên nằm trong danh sách toàn diện này, vui lòng chia sẻ chúng trong phần bình luận. Những đóng góp của bạn có thể là vô giá đối với những người khác trên hành trình học tập của họ, tạo ra một không gian tương tác và hợp tác để làm giàu kiến thức.

Kanwal Mehreen là một nhà phát triển phần mềm đầy tham vọng, rất quan tâm đến khoa học dữ liệu và các ứng dụng của AI trong y học. Kanwal đã được chọn là Google Generation Scholar 2022 cho khu vực APAC. Kanwal thích chia sẻ kiến thức kỹ thuật bằng cách viết các bài báo về các chủ đề thịnh hành và đam mê cải thiện sự đại diện của phụ nữ trong ngành công nghệ.