Meta va lancer le modèle de langage IA LLaMA pour aider les chercheurs et prendre en charge ChatGPT

Republié par Platon

Suiveurs: 0

Meta a annoncé vendredi la publication d'un nouveau modèle de langage basé sur l'intelligence artificielle alors que la course à l'IA générative se réchauffe, a déclaré vendredi le PDG Mark Zuckerberg. Le nouveau modèle de langage est destiné à être utilisé dans la recherche et sera disponible pour les chercheurs universitaires, le gouvernement, la société civile et les organisations universitaires, ainsi que pour la recherche industrielle.

Le modèle de langage, appelé LLaMA, est conçu pour générer du texte et des conversations, résumer des documents écrits et effectuer des tâches complexes telles que la résolution de théorèmes mathématiques ou la prédiction de structures protéiques. Dans un Après Facebook, Méta a dit :

«Nous introduisons LLaMA, une collection de modèles de langage de base allant de paramètres 7B à 65B. Nous formons nos modèles sur des billions de jetons et montrons qu'il est possible de former des modèles de pointe en utilisant exclusivement des ensembles de données accessibles au public, sans recourir à des ensembles de données propriétaires et inaccessibles. En particulier, LLaMA-13B surpasse GPT-3 (175B) sur la plupart des benchmarks, et LLaMA-65B est compétitif avec les meilleurs modèles, Chinchilla70B et PaLM-540B. Nous publions tous nos modèles à la communauté des chercheurs.

Toujours dans un post sur Twitter, Guillaume Lample, chercheur chez Facebook AI Research, a déclaré :

"Aujourd'hui, nous publions LLaMA, 4 modèles de fondation allant de paramètres 7B à 65B. LLaMA-13B surpasse OPT et GPT-3 175B sur la plupart des benchmarks. LLaMA-65B est compétitif avec Chinchilla 70B et PaLM 540B.

Aujourd'hui, nous publions LLaMA, 4 modèles de fondation allant des paramètres 7B à 65B.
LLaMA-13B surpasse OPT et GPT-3 175B sur la plupart des benchmarks. LLaMA-65B est compétitif avec Chinchilla 70B et PaLM 540B.
Les poids pour tous les modèles sont ouverts et disponibles sur https://t.co/q51f2oPZlE
1 / n pic.twitter.com/DPyJFBfWEq

– Guillaume Lampe (@GuillaumeLample) 24 février 2023

Le ChatGPT a gagné en popularité après sa sortie le 30 novembre 2022. Le chatbot alimenté par l'IA d'OpenAI pouvait pratiquement tout faire, de l'écriture de poésie à la correction des erreurs de codage avec des exemples détaillés, en passant par la génération d'invites d'art de l'IA. Cela peut même expliquer la complexité temporelle dans le pire des cas de l'algorithme de tri à bulles.

En seulement deux mois, ChatGPT a atteint 100 millions d'utilisateurs actifs mensuels en janvier, ce qui en fait l'application grand public à la croissance la plus rapide de l'histoire. La semaine dernière, la société a annoncé qu'elle lançait ChatGPT Plus, un plan d'abonnement pilote de 20 $ par mois pour son populaire chatbot alimenté par l'IA. Le succès soudain de ChatGPT a mis plus de pression sur d'autres entreprises technologiques, notamment Google, Baidu et Alibaba.

ChatGPT est une interface de chat IA basée sur le dialogue pour sa famille GPT-3 de grands modèles de langage. L'époustouflant ChatGPT est le successeur du Generative Pre-trained Transformer 3 (GPT-3), qui est un modèle de langage autorégressif qui utilise l'apprentissage en profondeur pour produire un texte de type humain.

ChatGPT a été adapté du modèle GPT-3.5 mais formé pour fournir des réponses plus conversationnelles. Cependant, contrairement au GPT-3, le nouveau ChatGPT présente un éventail de nouvelles fonctionnalités, notamment la possibilité d'engager des conversations avec les utilisateurs, d'écrire des codes logiciels, de raconter des histoires et de fournir des solutions à des équations mathématiques complexes. La beauté de tout cela est que vous pouvez tester le nouveau chatbot par vous-même ici.

Vous pouvez télécharger une copie PDF du livre blanc LLaMA ci-dessous.

333078981_693988129081760_4712707815225756708_n

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
Platoblockchain. Intelligence métaverse Web3. Connaissance Amplifiée. Accéder ici.
La source: https://techstartups.com/2023/02/24/meta-to-launch-ai-language-model-llama-to-help-researchers-and-take-on-chatgpt/

Horodatage: 24 février 2023

Horodatage: Le 13 janvier 2023

Meta va lancer le modèle de langage d'IA LLaMA pour aider les chercheurs et affronter ChatGPT

Republié par Platon

Plus de Startups technologiques

De l’introduction en bourse chérie à la radiation : le voyage tumultueux de la startup technologique autonome TuSimple se termine avec la sortie du Nasdaq – TechStartups

La startup néerlandaise Instruqt clôture un financement de série A de 15 millions d'euros après 5 ans de démarrage

L’IA aura un impact sur 60 % des emplois dans les économies avancées, prévient le FMI – TechStartups

Bill Gates dit que les cryptos et les NFT sont "100%" basés sur The Greater Fool Theory

L'échange de crypto AAX embauche et double son personnel alors que d'autres échanges licencient du personnel

JPMorgan va investir plus de 200 millions de dollars dans les technologies émergentes d'élimination du carbone

Les ingénieurs de Tesla dévoilent un système audio interne qui produit 120 dB+ pour une grosse caisse que vous pouvez sentir dans votre estomac –

L'agrégateur d'actualités SmartNews licencie 40 % de son personnel aux États-Unis et en Chine, d'autres licenciements sont prévus au Japon

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte