Meta が AI 言語モデル LLaMA を立ち上げ、研究者を支援し、ChatGPT に挑戦

プラトン再発行

フォロワー： 0

Meta は金曜日、ジェネレーティブ AI 競争が過熱する中、人工知能に基づく新しい言語モデルをリリースすると発表した、と CEO の Mark Zuckerberg は金曜日に述べた。新しい言語モデルは研究での使用を目的としており、学術研究者、政府、市民社会、学術組織、および業界研究で利用できるようになります。

LLaMA と呼ばれる言語モデルは、テキストと会話を生成し、書かれた資料を要約し、数学の定理を解いたり、タンパク質構造を予測したりするなどの複雑なタスクを実行するように設計されています。で Facebookのポスト、メタは言った：

「7B から 65B のパラメーターに及ぶ基礎言語モデルのコレクションである LLaMA を紹介します。何兆ものトークンでモデルをトレーニングし、独自のアクセスできないデータセットに頼ることなく、公開されているデータセットのみを使用して最先端のモデルをトレーニングできることを示しています。特に、LLaMA-13B はほとんどのベンチマークで GPT-3 (175B) を上回り、LLaMA-65B は最高のモデルである Chinchilla70B および PaLM-540B と競合します。私たちはすべてのモデルを研究コミュニティにリリースします。」

また、Twitter の投稿で、Facebook AI Research のリサーチサイエンティストである Guillaume Lample 氏は次のように述べています。

「本日、4B から 7B パラメータまでの 65 つのファンデーションモデルである LLaMA をリリースします。 LLaMA-13B は、ほとんどのベンチマークで OPT および GPT-3 175B よりも優れています。 LLaMA-65B は、チンチラ 70B および PaLM 540B と競合します。」

本日、4B から 7B パラメータまでの 65 つの基本モデル LLaMA をリリースしました。
LLaMA-13B は、ほとんどのベンチマークで OPT および GPT-3 175B よりも優れています。 LLaMA-65B は、チンチラ 70B および PaLM 540B と競合します。
すべてのモデルのウェイトは公開されており、次の Web サイトで入手できます。 https://t.co/q51f2oPZlE
1 / N pic.twitter.com/DPyJFBfWEq

— ギヨーム・ランプル (@GuillaumeLample) 2023 年 2 月 24 日

ChatGPT は、30 年 2022 月 XNUMX 日にリリースされた後、人気が急上昇しました。OpenAI の AI 搭載チャットボットは、詩を書いたり、詳細な例を使用してコーディングミスを修正したり、AI アートプロンプトを生成したりすることから、事実上すべてを実行できます。バブルソートアルゴリズムの最悪の場合の時間の複雑さも説明できます。

わずか 100 か月で、ChatGPT は 20 月に月間アクティブユーザー数が XNUMX 億人に達し、史上最も急速に成長している消費者向けアプリケーションになりました。先週、同社は、人気の AI 搭載チャットボットの月額 XNUMX ドルのパイロットサブスクリプションプランである ChatGPT Plus を開始すると発表しました。 ChatGPT の突然の成功は、Google、Baidu、Alibaba などの他のテクノロジー企業にさらなる圧力をかけています。

ChatGPT は、大規模言語モデルの GPT-3 ファミリー向けの対話ベースの AI チャットインターフェイスです。驚異的な ChatGPT は、深層学習を使用して人間のようなテキストを生成する自己回帰言語モデルである Generative Pre-trained Transformer 3 (GPT-3) の後継です。

ChatGPT は GPT-3.5 モデルから採用されましたが、より会話的な回答を提供するようにトレーニングされています。ただし、GPT-3 とは異なり、新しい ChatGPT は、ユーザーとの会話、ソフトウェアコードの作成、ストーリーの説明、複雑な数式の解の提供など、一連の新しい機能を示しています。すべての利点は、ここで新しいチャットボットを自分でテストできることです.

以下から LLaMA ホワイトペーパーの PDF コピーをダウンロードできます。

333078981_693988129081760_4712707815225756708_n