Daftar Lengkap Sumber Daya untuk Menguasai Model Bahasa Besar - KDnuggets

Daftar Lengkap Sumber Daya untuk Menguasai Model Bahasa Besar – KDnuggets

Node Sumber: 2974027

Daftar Lengkap Sumber Daya untuk Menguasai Model Bahasa Besar
Gambar dihasilkan dengan Leonardo.Ai
 

Dalam lanskap AI yang luas ini, kekuatan revolusioner muncul dalam bentuk Large Language Model (LLMS). Ini bukan sekedar kata kunci tapi masa depan kita. Kemampuan mereka untuk memahami dan menghasilkan teks mirip manusia membuat mereka menjadi sorotan dan kini menjadi salah satu bidang penelitian terpanas. Bayangkan sebuah chatbot yang dapat merespons Anda seolah-olah Anda sedang berbicara dengan teman atau membayangkan sistem pembuatan konten yang sulit dibedakan apakah itu ditulis oleh manusia atau AI. Jika hal seperti ini membuat Anda penasaran dan ingin mendalami lebih jauh jantung LLM, maka Anda berada di tempat yang tepat. Saya telah mengumpulkan daftar lengkap sumber daya mulai dari artikel informatif, kursus, dan repositori GitHub hingga makalah penelitian relevan yang dapat membantu Anda memahaminya dengan lebih baik. Tanpa penundaan lebih lanjut, mari kita mulai perjalanan menakjubkan kita di dunia LLM. 

Daftar Lengkap Sumber Daya untuk Menguasai Model Bahasa Besar
Image by Polina Tankilevich di Pexels 

1. Spesialisasi Pembelajaran Mendalam – Coursera

link: Spesialisasi Pembelajaran Dalam

Deskripsi: Pembelajaran mendalam membentuk tulang punggung LLM. Kursus komprehensif yang diajarkan oleh Andrew Ng ini mencakup topik penting jaringan saraf, dasar-dasar Visi komputer dan Pemrosesan Bahasa Alami, dan cara menyusun proyek pembelajaran mesin Anda. 

2. Stanford CS224N: NLP dengan Pembelajaran Mendalam – YouTube

link: Stanford CS224N: NLP dengan Pembelajaran Mendalam

Deskripsi: Ini adalah tambang emas pengetahuan dan memberikan pengenalan menyeluruh terhadap penelitian mutakhir dalam pembelajaran mendalam untuk NLP.

3. Kursus Transformer HuggingFace – HuggingFace

link: Kursus Transformer HuggingFace

Deskripsi: Kursus ini mengajarkan NLP dengan menggunakan perpustakaan dari ekosistem HuggingFace. Ini mencakup cara kerja dan penggunaan perpustakaan berikut dari HuggingFace:

  • transformer
  • Tokenizer
  • Dataset
  • Mempercepat

4. Rekayasa Prompt ChatGPT untuk Pengembang – Coursera

link: Kursus Rekayasa Prompt ChatGPT

Deskripsi: ChatGPT adalah LLM yang populer dan kursus ini berbagi praktik terbaik dan prinsip-prinsip penting untuk menulis perintah yang efektif untuk menghasilkan respons yang lebih baik.

Daftar Lengkap Sumber Daya untuk Menguasai Model Bahasa Besar
Gambar dihasilkan dengan Leonardo.Ai

1. Universitas LLM – Cohere

link: Universitas LLM 

Deskripsi: Cohere menawarkan kursus khusus untuk menguasai LLM. Jalur sekuensial mereka, yang mencakup aspek teoritis NLP, LLM, dan arsitekturnya secara detail, ditargetkan untuk pemula. Jalur non-sekuensialnya diperuntukkan bagi individu berpengalaman yang lebih tertarik pada aplikasi praktis dan kasus penggunaan model canggih ini dibandingkan cara kerja internalnya.

2. Stanford CS324: Model Bahasa Besar – Situs Stanford

link: Stanford CS324: Model Bahasa Besar

Deskripsi: Kursus ini menyelami lebih dalam seluk-beluk model ini. Anda akan mempelajari dasar-dasar, teori, etika, dan aspek praktis dari model-model ini sambil juga mendapatkan pengalaman langsung.

3. Princeton COS597G: Memahami Model Bahasa Besar – Situs Princeton

link: Memahami Model Bahasa Besar

Deskripsi: Ini adalah kursus tingkat pascasarjana yang menawarkan kurikulum komprehensif, menjadikannya pilihan yang sangat baik untuk pembelajaran mendalam. Anda akan menjelajahi dasar teknis, kemampuan, dan batasan model seperti model BERT, GPT, T5, model campuran ahli, model berbasis pengambilan, dll.

4. ETH Zurich: Model Bahasa Besar (LLM) – RycoLab

link: ETH Zurich: Model Bahasa Besar

Deskripsi: Kursus yang baru dirancang ini menawarkan eksplorasi LLM yang komprehensif. Pelajari dasar-dasar probabilistik, pemodelan jaringan saraf, proses pelatihan, teknik penskalaan, dan diskusi penting tentang keamanan dan potensi penyalahgunaan.

5. Bootcamp LLM Tumpukan Penuh – Tumpukan Penuh

link: Kamp Pelatihan LLM Tumpukan Penuh

Deskripsi: Kamp pelatihan LLM Full Stack adalah kursus yang relevan dengan industri yang mencakup topik-topik seperti teknik teknik cepat, dasar-dasar LLM, strategi penerapan, dan desain antarmuka pengguna, memastikan peserta siap untuk membangun dan menerapkan aplikasi LLM.

6. Menyempurnakan Model Bahasa Besar – Coursera

link: Menyempurnakan Model Bahasa Besar

Deskripsi: Fine Tuning adalah teknik yang memungkinkan Anda menyesuaikan LLM dengan kebutuhan spesifik Anda. Dengan menyelesaikan kursus ini, Anda akan memahami kapan harus menerapkan penyempurnaan, persiapan data untuk penyempurnaan, dan cara melatih LLM Anda tentang data baru dan mengevaluasi kinerjanya.

Daftar Lengkap Sumber Daya untuk Menguasai Model Bahasa Besar
Gambar dihasilkan dengan Leonardo.Ai

1. Apa yang Dilakukan ChatGPT… dan Mengapa Ini Berhasil? – Steven Wolfram

link: Apa yang Dilakukan ChatGPT… dan Mengapa Ini Berhasil?

Deskripsi: Buku pendek ini ditulis oleh Steven Wolfram, seorang ilmuwan ternama. Dia membahas aspek mendasar ChatGPT, asal usulnya dalam jaringan saraf, dan kemajuannya dalam transformator, mekanisme perhatian, dan pemrosesan bahasa alami. Ini adalah bacaan yang sangat bagus bagi seseorang yang tertarik untuk mengeksplorasi kemampuan dan keterbatasan LLM.

2. Memahami Model Bahasa Besar: Daftar Bacaan Transformatif – Sebastian Raschka

link: Memahami Model Bahasa Besar: Daftar Bacaan Transformatif

Deskripsi: Ini berisi kumpulan makalah penelitian penting dan memberikan daftar bacaan kronologis, mulai dari makalah awal tentang jaringan saraf berulang (RNN) hingga model BERT yang berpengaruh dan seterusnya. Ini adalah sumber daya yang sangat berharga bagi para peneliti dan praktisi untuk mempelajari evolusi NLP dan LLM.

3. Seri Artikel: Model Bahasa Besar – Jay Alammar

link: Seri Artikel: Model Bahasa Besar

Deskripsi: Blog Jay Alammar adalah gudang pengetahuan bagi siapa pun yang mempelajari model bahasa besar (LLM) dan transformator. Blog-blognya menonjol karena perpaduan unik antara visualisasi, penjelasan intuitif, dan cakupan subjek yang komprehensif.

4. Membangun Aplikasi LLM untuk Produksi – Chip Huyen

link: Membangun Aplikasi LLM untuk Produksi

Deskripsi: Dalam artikel ini, tantangan produksi LLM dibahas. Ini menawarkan wawasan tentang komposisi tugas dan menampilkan kasus penggunaan yang menjanjikan. Siapa pun yang tertarik dengan LLM praktis akan menganggapnya sangat berharga.

Daftar Lengkap Sumber Daya untuk Menguasai Model Bahasa Besar
Image by RealToughCandy.com di Pexels 

1. Luar Biasa-LLM (9k ⭐ )

link:  Luar biasa-LLM

Deskripsi: Ini adalah kumpulan makalah, kerangka kerja, alat, kursus, tutorial, dan sumber daya yang dikurasi dan berfokus pada model bahasa besar (LLM), dengan penekanan khusus pada ChatGPT.

2. Panduan Praktis LLM ( 6.9k ⭐ )

link:  Panduan Praktis untuk Model Bahasa Besar

Deskripsi: Ini membantu para praktisi untuk menavigasi lanskap LLM yang luas. Hal ini berdasarkan makalah survei berjudul: Memanfaatkan Kekuatan LLM dalam Praktek: Survei tentang ChatGPT dan Selebihnya dan ini blog. 

3. Survei LLM ( 6.1k ⭐ )

link:  Survei LLM

Deskripsi: Ini adalah kumpulan makalah survei dan sumber daya berdasarkan makalah berjudul: Survei Model Bahasa Besar. Ini juga berisi ilustrasi evolusi teknis model seri GPT serta grafik evolusi penelitian yang dilakukan di LLaMA.

4. Grafik-LLM Luar Biasa ( 637 ⭐ )

link:  Luar Biasa-Grafik-LLM

Deskripsi: Ini adalah sumber berharga bagi orang-orang yang tertarik pada persimpangan teknik berbasis grafik dengan LLM. ia menyediakan kumpulan makalah penelitian, kumpulan data, tolok ukur, survei, dan alat yang menyelidiki bidang yang sedang berkembang ini.

5. Langchain yang Luar Biasa ( 5.4k ⭐ )

link:  mengagumkan-langchain

Deskripsi: LangChain adalah kerangka kerja yang cepat dan efisien untuk proyek LLM dan repositori ini adalah pusat untuk melacak inisiatif dan proyek yang terkait dengan ekosistem LangChain. 

  1. "Survei Lengkap ChatGPT di Era AIGC” – Ini adalah titik awal yang bagus untuk pemula di LLM. Panduan ini secara komprehensif mencakup teknologi dasar, aplikasi, dan tantangan ChatGPT.
  2. "Survei Model Bahasa Besar” – Ini mencakup kemajuan terkini dalam LLM khususnya dalam empat aspek utama pra-pelatihan, penyesuaian adaptasi, pemanfaatan, dan evaluasi kapasitas.
  3. "Tantangan dan Penerapan Model Bahasa Besar” – Membahas tantangan LLM dan keberhasilan penerapan LLM.
  4. "Perhatian Yang Anda Butuhkan” – Transformer berfungsi sebagai landasan bagi GPT dan LLM lainnya dan makalah ini memperkenalkan arsitektur Transformer. 
  5. "Transformator Beranotasi” – Sumber daya dari Universitas Harvard yang memberikan penjelasan rinci dan beranotasi tentang arsitektur Transformer, yang merupakan dasar bagi banyak LLM.
  6. "Transformer Ilustrasi” – Panduan visual yang membantu Anda memahami arsitektur Transformer secara mendalam, menjadikan konsep kompleks lebih mudah diakses.
  7. "BERT: Pra-pelatihan Transformers Dua Arah Dalam untuk Pemahaman Bahasa” – Makalah ini memperkenalkan BERT, LLM yang sangat berpengaruh yang menetapkan tolok ukur baru untuk berbagai tugas Natural Language Processing (NLP).

Dalam artikel ini, saya telah menyusun daftar lengkap sumber daya yang penting untuk menguasai Model Bahasa Besar (LLM). Namun, pembelajaran adalah sebuah proses yang dinamis, dan berbagi pengetahuan adalah inti dari proses tersebut. Jika Anda memiliki sumber daya tambahan yang menurut Anda harus menjadi bagian dari daftar lengkap ini, jangan ragu untuk membagikannya di bagian komentar. Kontribusi Anda bisa sangat berharga bagi orang lain dalam perjalanan pembelajaran mereka, menciptakan ruang interaktif dan kolaboratif untuk pengayaan pengetahuan.
 
 

Kanwal Mehreen adalah pengembang perangkat lunak yang bercita-cita tinggi dengan minat dalam ilmu data dan aplikasi AI dalam kedokteran. Kanwal terpilih sebagai Google Generation Scholar 2022 untuk wilayah APAC. Kanwal suka berbagi pengetahuan teknis dengan menulis artikel tentang topik yang sedang tren, dan bersemangat untuk meningkatkan representasi perempuan di industri teknologi.

Stempel Waktu:

Lebih dari KDnugget