掌握大型语言模型的资源综合列表 - KDnuggets

掌握大型语言模型的资源综合列表 – KDnuggets

源节点: 2974027

掌握大型语言模型的资源综合列表
使用 Leonardo.Ai 生成的图像
 

在广阔的人工智能领域,一股革命性的力量以大型语言模型(LLMS)的形式出现。 这不仅仅是一个流行词,而是我们的未来。 它们理解和生成类人文本的能力使它们成为人们关注的焦点,现在它已成为最热门的研究领域之一。 想象一个聊天机器人,它可以像你在和你的朋友交谈一样对你做出回应,或者想象一个内容生成系统,它变得很难区分它是由人类还是人工智能编写的。 如果这样的事情引起您的兴趣,并且您想进一步深入了解法学硕士的核心,那么您来对地方了。 我收集了一份全面的资源列表,从内容丰富的文章、课程、GitHub 存储库到相关研究论文,可以帮助您更好地理解它们。 事不宜迟,让我们开始我们在法学硕士世界的奇妙旅程。 

掌握大型语言模型的资源综合列表
图片由 波琳娜·坦基列维奇 在 Pexels 上 

1.深度学习专业化——Coursera

链接: 深度学习专业化

描述: 深度学习构成了法学硕士的支柱。 这门由 Andrew Ng 教授的综合课程涵盖了神经网络的基本主题、计算机视觉和自然语言处理的基础知识,以及如何构建机器学习项目。 

2. 斯坦福大学 CS224N:NLP 与深度学习 – YouTube

链接: 斯坦福 CS224N:NLP 与深度学习

描述: 它是知识的金矿,全面介绍了 NLP 深度学习的前沿研究。

3. HuggingFace 变形金刚课程 – HuggingFace

链接: HuggingFace 变形金刚课程

描述: 本课程使用 HuggingFace 生态系统中的库教授 NLP。 它涵盖了 HuggingFace 中以下库的内部工作原理和用法:

  • 变压器
  • 分词器
  • 数据集
  • 加快

4. ChatGPT 为开发人员提供提示工程 – Coursera

链接: ChatGPT 即时工程课程

描述: ChatGPT 是一门受欢迎的法学硕士,本课程分享了编写有效提示以更好地生成响应的最佳实践和基本原则。

掌握大型语言模型的资源综合列表
使用 Leonardo.Ai 生成的图像

1. 法学硕士大学-Cohere

链接: 法学硕士大学 

描述: Cohere 提供掌握法学硕士的专业课程。 他们的连续课程涵盖了 NLP、LLM 的理论方面及其详细架构,面向初学者。 他们的非顺序路径适合经验丰富的个人,他们对这些强大模型的实际应用和用例更感兴趣,而不是对它们的内部工作感兴趣。

2. 斯坦福 CS324:大型语言模型 – 斯坦福网站

链接: 斯坦福 CS324:大型语言模型

描述: 本课程将深入探讨这些模型的复杂性。 您将探索这些模型的基础知识、理论、伦理和实践方面,同时获得一些实践经验。

3. 普林斯顿 COS597G:理解大型语言模型 – 普林斯顿网站

链接: 理解大型语言模型

描述: 它是一门研究生水平的课程,提供全面的课程,使其成为深度学习的绝佳选择。 您将探索 BERT、GPT、T5 模型、专家混合模型、基于检索的模型等模型的技术基础、功能和局限性。

4. 苏黎世联邦理工学院:大型语言模型(LLM)——RycoLab

链接: 苏黎世联邦理工学院:大型语言模型

描述: 这门新设计的课程对法学硕士进行了全面的探索。 深入研究概率基础、神经网络建模、训练过程、扩展技术以及有关安全性和潜在滥用的关键讨论。

5.全栈LLM训练营——全栈

链接: 全栈LLM训练营

描述: 全栈 LLM 训练营是一门与行业相关的课程,涵盖快速工程技术、LLM 基础知识、部署策略和用户界面设计等主题,确保参与者为构建和部署 LLM 应用程序做好充分准备。

6. 微调大型语言模型 – Coursera

链接: 微调大型语言模型

描述: 微调是一种允许您根据您的特定需求调整法学硕士的技术。 通过完成本课程,您将了解何时应用微调、微调的数据准备,以及如何使用新数据训练法学硕士并评估其性能。

掌握大型语言模型的资源综合列表
使用 Leonardo.Ai 生成的图像

1. ChatGPT 的作用是什么……以及它为何有效? ——史蒂文·沃尔夫拉姆

链接: ChatGPT 正在做什么……以及它为何有效?

描述: 这本小书由著名科学家史蒂文·沃尔夫勒姆 (Steven Wolfram) 撰写。 他讨论了 ChatGPT 的基本方面、它在神经网络中的起源,以及它在转换器、注意力机制和自然语言处理方面的进展。 对于有兴趣探索法学硕士的能力和局限性的人来说,这是一本极好的读物。

2. 理解大型语言模型:变革性阅读清单 – Sebastian Raschka

链接: 理解大型语言模型:变革性阅读清单

描述: 它包含一系列重要的研究论文,并提供按时间顺序排列的阅读列表,从有关循环神经网络 (RNN) 的早期论文到有影响力的 BERT 模型等。 对于研究人员和从业者来说,这是研究 NLP 和 LLM 演变的宝贵资源。

3.系列文章:大型语言模型 – Jay Alammar

链接: 文章系列:大型语言模型

描述: 对于任何研究大型语言模型 (LLM) 和 Transformer 的人来说,Jay Alammar 的博客都是知识宝库。 他的博客因其独特的可视化、直观解释和对主题的全面覆盖而脱颖而出。

4. 构建用于生产的 LLM 申请 – Chip Huyen

链接: 构建用于生产的法学硕士申请

描述: 在本文中,讨论了法学硕士生产化的挑战。 它提供了对任务可组合性的见解并展示了有前景的用例。 任何对实用法学硕士感兴趣的人都会发现它非常有价值。

掌握大型语言模型的资源综合列表
图片由 RealToughCandy.com 在 Pexels 上 

1. 很棒的法学硕士 ( 9k ⭐ )

链接:  太棒了-LLM

描述: 它是专注于大型语言模型 (LLM) 的论文、框架、工具、课程、教程和资源的精选集合,特别强调 ChatGPT。

2. 法学硕士实用指南 ( 6.9k ⭐ )

链接:  大型语言模型实用指南

描述: 它可以帮助从业者驾驭法学硕士的广阔前景。 它基于标题为:的调查论文: 在实践中利用法学硕士的力量:对 ChatGPT 及其他内容的调查Free Introduction 博客。 

3. 法学硕士调查 ( 6.1k ⭐ )

链接:  法学硕士调查

描述: 它是基于以下论文的调查论文和资源的集合: 大型语言模型综述。 它还包含 GPT 系列模型的技术演变的说明以及 LLaMA 上进行的研究工作的演变图。

4. 很棒的图表-LLM ( 637 ⭐ )

链接:  Awesome-Graph-LLM

描述: 对于对基于图的技术与法学硕士的交叉感兴趣的人来说,这是一个很有价值的资源。 它提供了一系列深入研究这一新兴领域的研究论文、数据集、基准、调查和工具。

5. 很棒的 Langchain ( 5.4k ⭐ )

链接:  真棒langchain

描述: LangChain是LLM项目快速高效的框架,该存储库是跟踪与LangChain生态系统相关的举措和项目的中心。 

  1. AIGC 时代 ChatGPT 全面综述” – 对于法学硕士初学者来说,这是一个很好的起点。 它全面涵盖了ChatGPT的底层技术、应用和挑战。
  2. 大型语言模型综述” – 它涵盖了法学硕士的最新进展,特别是在预训练、适应调优、利用和能力评估四个主要方面。
  3. 大型语言模型的挑战和应用” – 讨论法学硕士的挑战以及法学硕士的成功应用领域。
  4. 注意就是您所需要的” – Transformer 是 GPT 和其他 LLM 的基石,本文介绍了 Transformer 架构。 
  5. 带注释的变压器” – 哈佛大学的资源,提供了 Transformer 架构的详细和带注释的解释,这是许多法学硕士的基础。
  6. 图解变压器” – 视觉指南,帮助您深入了解 Transformer 架构,使复杂的概念更容易理解。
  7. BERT:用于语言理解的深度双向变压器的预训练” – 本文介绍了 BERT,这是一个极具影响力的法学硕士,为众多自然语言处理 (NLP) 任务设定了新基准。

在本文中,我整理了掌握大型语言模型 (LLM) 所必需的大量资源。 然而,学习是一个动态的过程,知识共享是其核心。 如果您认为应该包含在这个综合列表中的其他资源,请随时在评论部分分享。 您的贡献对于其他人的学习之旅可能是无价的,为丰富知识创造了一个互动和协作的空间。
 
 

坎瓦尔·梅林 是一位有抱负的软件开发人员,对数据科学和人工智能在医学中的应用有着浓厚的兴趣。 Kanwal 被选为 2022 年亚太地区 Google Generation Scholar。 Kanwal 喜欢通过撰写有关热门话题的文章来分享技术知识,并且热衷于提高女性在科技行业的代表性。

时间戳记:

更多来自 掘金队