Meta 推出 AI 语言模型 LLaMA 以帮助研究人员并接管 ChatGPT

Meta 推出 AI 语言模型 LLaMA 以帮助研究人员并接管 ChatGPT

源节点: 1976707

首席执行官马克扎克伯格周五表示,随着生成人工智能竞赛的升温,Meta 周五宣布将发布一种基于人工智能的新语言模型。 新的语言模型旨在用于研究,并将可供学术研究人员、政府、民间社会和学术组织以及行业研究使用。

这种名为 LLaMA 的语言模型旨在生成文本和对话、总结书面材料以及执行复杂的任务,例如解决数学定理或预测蛋白质结构。 在一个 Facebook发布, 元说:

“我们介绍了 LLaMA,这是一组基础语言模型,参数范围从 7B 到 65B。 我们在数万亿个令牌上训练我们的模型,并表明可以仅使用公开可用的数据集来训练最先进的模型,而无需诉诸专有和不可访问的数据集。 特别是,LLaMA-13B 在大多数基准测试中都优于 GPT-3 (175B),而 LLaMA-65B 可与最佳模型 Chinchilla70B 和 PaLM-540B 竞争。 我们将所有模型发布给研究界。”

同样在 Twitter 帖子中,Facebook AI Research 的研究科学家 Guillaume Lample 说:

“今天我们发布了 LLaMA,4 个基础模型,参数从 7B 到 65B。 LLaMA-13B 在大多数基准测试中优于 OPT 和 GPT-3 175B。 LLaMA-65B 可与 Chinchilla 70B 和 PaLM 540B 竞争。”

ChatGPT 在 30 年 2022 月 XNUMX 日发布后人气飙升。OpenAI 的人工智能聊天机器人几乎可以做任何事情,从写诗、用详细的例子纠正编码错误,到生成人工智能艺术提示。 它甚至可以解释冒泡排序算法的最坏情况时间复杂度。

在短短两个月的时间里,ChatGPT 在 100 月份的月活跃用户达到了 20 亿,成为历史上增长最快的消费者应用程序。 上周,该公司宣布推出 ChatGPT Plus,这是一项针对其广受欢迎的人工智能聊天机器人的每月 XNUMX 美元的试点订阅计划。 ChatGPT 的突然成功给包括谷歌、百度和阿里巴巴在内的其他科技公司带来了更大的压力。

ChatGPT 是一个基于对话的 AI 聊天界面,适用于其 GPT-3 大型语言模型系列。 令人惊叹的 ChatGPT 是 Generative Pre-trained Transformer 3 (GPT-3) 的继承者,后者是一种自回归语言模型,使用深度学习来生成类似人类的文本。

ChatGPT 改编自 GPT-3.5 模型,但经过训练可以提供更多对话式答案。 然而,与 GPT-3 不同的是,新的 ChatGPT 展示了一系列新功能,包括与用户进行对话、编写软件代码、讲故事以及为复杂的数学方程式提供解决方案的能力。 这一切的美妙之处在于,您可以在这里亲自测试新的聊天机器人。

您可以在下方下载 LLaMA 白皮书的 PDF 副本。

333078981_693988129081760_4712707815225756708_n

时间戳记:

更多来自 科技创业公司