Meta lanceert AI-taalmodel LLaMA om onderzoekers te helpen en ChatGPT aan te pakken

Meta lanceert AI-taalmodel LLaMA om onderzoekers te helpen en ChatGPT aan te pakken

Bronknooppunt: 1976707

Meta kondigde vrijdag aan dat het een nieuw taalmodel uitbrengt op basis van kunstmatige intelligentie terwijl de generatieve AI-race opwarmt, zei CEO Mark Zuckerberg vrijdag. Het nieuwe taalmodel is bedoeld voor gebruik in onderzoek en zal beschikbaar zijn voor academische onderzoekers, overheid, maatschappelijke en academische organisaties en onderzoek uit de industrie.

Het taalmodel, LLaMA genaamd, is ontworpen om tekst en gesprekken te genereren, geschreven materiaal samen te vatten en gecompliceerde taken uit te voeren, zoals het oplossen van wiskundige stellingen of het voorspellen van eiwitstructuren. In een Facebook bericht, zei Meta:

“We introduceren LLaMA, een verzameling basistaalmodellen variërend van 7B tot 65B parameters. We trainen onze modellen op biljoenen tokens en laten zien dat het mogelijk is om state-of-the-art modellen te trainen met uitsluitend openbaar beschikbare datasets, zonder toevlucht te nemen tot eigen en ontoegankelijke datasets. Met name LLaMA-13B presteert beter dan GPT-3 (175B) op de meeste benchmarks, en LLaMA-65B kan concurreren met de beste modellen, Chinchilla70B en PaLM-540B. We geven al onze modellen vrij aan de onderzoeksgemeenschap.”

Ook in een Twitter-bericht zei Research Scientist bij Facebook AI Research Guillaume Lample:

“Vandaag brengen we LLaMA uit, 4 basismodellen variërend van 7B tot 65B parameters. LLaMA-13B presteert beter dan OPT en GPT-3 175B op de meeste benchmarks. LLaMA-65B is concurrerend met Chinchilla 70B en PaLM 540B.”

De ChatGPT werd enorm populair na de release op 30 november 2022. De door AI aangedreven chatbot van OpenAI kon vrijwel alles, van het schrijven van poëzie en het corrigeren van codeerfouten met gedetailleerde voorbeelden tot het genereren van AI-kunstprompts. Het kan zelfs de worst-case tijdcomplexiteit van het bellensorteeralgoritme verklaren.

In slechts twee maanden tijd bereikte ChatGPT in januari 100 miljoen maandelijks actieve gebruikers, waarmee het de snelst groeiende consumententoepassing in de geschiedenis is. Vorige week kondigde het bedrijf aan dat het ChatGPT Plus lanceerde, een proefabonnement van $ 20 per maand voor zijn populaire AI-aangedreven chatbot. Het plotselinge succes van ChatGPT heeft andere technologiebedrijven, waaronder Google, Baidu en Alibaba, meer onder druk gezet.

ChatGPT is een op dialoog gebaseerde AI-chatinterface voor de GPT-3-familie van grote taalmodellen. De verbluffende ChatGPT is een opvolger van de Generative Pre-trained Transformer 3 (GPT-3), een autoregressief taalmodel dat deep learning gebruikt om mensachtige tekst te produceren.

ChatGPT is aangepast van het GPT-3.5-model, maar getraind om meer gemoedelijke antwoorden te geven. In tegenstelling tot de GPT-3 demonstreert de nieuwe ChatGPT echter een reeks nieuwe mogelijkheden, waaronder de mogelijkheid om gesprekken met gebruikers aan te gaan, softwarecodes te schrijven, verhalen te vertellen en oplossingen te bieden voor complexe wiskundige vergelijkingen. Het mooie van dit alles is dat je de nieuwe chatbot hier zelf kunt uitproberen.

U kunt hieronder een pdf-versie van de LLaMA-whitepaper downloaden.

333078981_693988129081760_4712707815225756708_n

Tijdstempel:

Meer van TechStartups