Meta va lancer le modèle de langage d'IA LLaMA pour aider les chercheurs et affronter ChatGPT

Meta va lancer le modèle de langage d'IA LLaMA pour aider les chercheurs et affronter ChatGPT

Nœud source: 1976707

Meta a annoncé vendredi la publication d'un nouveau modèle de langage basé sur l'intelligence artificielle alors que la course à l'IA générative se réchauffe, a déclaré vendredi le PDG Mark Zuckerberg. Le nouveau modèle de langage est destiné à être utilisé dans la recherche et sera disponible pour les chercheurs universitaires, le gouvernement, la société civile et les organisations universitaires, ainsi que pour la recherche industrielle.

Le modèle de langage, appelé LLaMA, est conçu pour générer du texte et des conversations, résumer des documents écrits et effectuer des tâches complexes telles que la résolution de théorèmes mathématiques ou la prédiction de structures protéiques. Dans un Après Facebook, Méta a dit :

«Nous introduisons LLaMA, une collection de modèles de langage de base allant de paramètres 7B à 65B. Nous formons nos modèles sur des billions de jetons et montrons qu'il est possible de former des modèles de pointe en utilisant exclusivement des ensembles de données accessibles au public, sans recourir à des ensembles de données propriétaires et inaccessibles. En particulier, LLaMA-13B surpasse GPT-3 (175B) sur la plupart des benchmarks, et LLaMA-65B est compétitif avec les meilleurs modèles, Chinchilla70B et PaLM-540B. Nous publions tous nos modèles à la communauté des chercheurs.

Toujours dans un post sur Twitter, Guillaume Lample, chercheur chez Facebook AI Research, a déclaré :

"Aujourd'hui, nous publions LLaMA, 4 modèles de fondation allant de paramètres 7B à 65B. LLaMA-13B surpasse OPT et GPT-3 175B sur la plupart des benchmarks. LLaMA-65B est compétitif avec Chinchilla 70B et PaLM 540B.

Le ChatGPT a gagné en popularité après sa sortie le 30 novembre 2022. Le chatbot alimenté par l'IA d'OpenAI pouvait pratiquement tout faire, de l'écriture de poésie à la correction des erreurs de codage avec des exemples détaillés, en passant par la génération d'invites d'art de l'IA. Cela peut même expliquer la complexité temporelle dans le pire des cas de l'algorithme de tri à bulles.

En seulement deux mois, ChatGPT a atteint 100 millions d'utilisateurs actifs mensuels en janvier, ce qui en fait l'application grand public à la croissance la plus rapide de l'histoire. La semaine dernière, la société a annoncé qu'elle lançait ChatGPT Plus, un plan d'abonnement pilote de 20 $ par mois pour son populaire chatbot alimenté par l'IA. Le succès soudain de ChatGPT a mis plus de pression sur d'autres entreprises technologiques, notamment Google, Baidu et Alibaba.

ChatGPT est une interface de chat IA basée sur le dialogue pour sa famille GPT-3 de grands modèles de langage. L'époustouflant ChatGPT est le successeur du Generative Pre-trained Transformer 3 (GPT-3), qui est un modèle de langage autorégressif qui utilise l'apprentissage en profondeur pour produire un texte de type humain.

ChatGPT a été adapté du modèle GPT-3.5 mais formé pour fournir des réponses plus conversationnelles. Cependant, contrairement au GPT-3, le nouveau ChatGPT présente un éventail de nouvelles fonctionnalités, notamment la possibilité d'engager des conversations avec les utilisateurs, d'écrire des codes logiciels, de raconter des histoires et de fournir des solutions à des équations mathématiques complexes. La beauté de tout cela est que vous pouvez tester le nouveau chatbot par vous-même ici.

Vous pouvez télécharger une copie PDF du livre blanc LLaMA ci-dessous.

333078981_693988129081760_4712707815225756708_n

Horodatage:

Plus de Startups technologiques