Meta推出AI语言模型LLaMA帮助研究人员并挑战ChatGPT

由柏拉图重新发布

关注： 0

首席执行官马克扎克伯格周五表示，随着生成人工智能竞赛的升温，Meta 周五宣布将发布一种基于人工智能的新语言模型。新的语言模型旨在用于研究，并将可供学术研究人员、政府、民间社会和学术组织以及行业研究使用。

这种名为 LLaMA 的语言模型旨在生成文本和对话、总结书面材料以及执行复杂的任务，例如解决数学定理或预测蛋白质结构。在一个 Facebook发布, 元说：

“我们介绍了 LLaMA，这是一组基础语言模型，参数范围从 7B 到 65B。我们在数万亿个令牌上训练我们的模型，并表明可以仅使用公开可用的数据集来训练最先进的模型，而无需诉诸专有和不可访问的数据集。特别是，LLaMA-13B 在大多数基准测试中都优于 GPT-3 (175B)，而 LLaMA-65B 可与最佳模型 Chinchilla70B 和 PaLM-540B 竞争。我们将所有模型发布给研究界。”

同样在 Twitter 帖子中，Facebook AI Research 的研究科学家 Guillaume Lample 说：

“今天我们发布了 LLaMA，4 个基础模型，参数从 7B 到 65B。 LLaMA-13B 在大多数基准测试中优于 OPT 和 GPT-3 175B。 LLaMA-65B 可与 Chinchilla 70B 和 PaLM 540B 竞争。”

今天我们发布了LLaMA，4个基础模型，参数从7B到65B不等。
LLaMA-13B 在大多数基准测试中优于 OPT 和 GPT-3 175B。 LLaMA-65B 可与 Chinchilla 70B 和 PaLM 540B 竞争。
所有型号的重量都是公开的，可在 https://t.co/q51f2oPZlE
1 / N pic.twitter.com/DPyJFBfWEq

— 纪尧姆·兰普尔 (@GuillaumeLample) 2023 年 2 月 24 日

ChatGPT 在 30 年 2022 月 XNUMX 日发布后人气飙升。OpenAI 的人工智能聊天机器人几乎可以做任何事情，从写诗、用详细的例子纠正编码错误，到生成人工智能艺术提示。它甚至可以解释冒泡排序算法的最坏情况时间复杂度。

在短短两个月的时间里，ChatGPT 在 100 月份的月活跃用户达到了 20 亿，成为历史上增长最快的消费者应用程序。上周，该公司宣布推出 ChatGPT Plus，这是一项针对其广受欢迎的人工智能聊天机器人的每月 XNUMX 美元的试点订阅计划。 ChatGPT 的突然成功给包括谷歌、百度和阿里巴巴在内的其他科技公司带来了更大的压力。

ChatGPT 是一个基于对话的 AI 聊天界面，适用于其 GPT-3 大型语言模型系列。令人惊叹的 ChatGPT 是 Generative Pre-trained Transformer 3 (GPT-3) 的继承者，后者是一种自回归语言模型，使用深度学习来生成类似人类的文本。

ChatGPT 改编自 GPT-3.5 模型，但经过训练可以提供更多对话式答案。然而，与 GPT-3 不同的是，新的 ChatGPT 展示了一系列新功能，包括与用户进行对话、编写软件代码、讲故事以及为复杂的数学方程式提供解决方案的能力。这一切的美妙之处在于，您可以在这里亲自测试新的聊天机器人。

您可以在下方下载 LLaMA 白皮书的 PDF 副本。

333078981_693988129081760_4712707815225756708_n