Meta per lanciare il modello di linguaggio AI LLaMA per aiutare i ricercatori e affrontare ChatGPT

Meta per lanciare il modello di linguaggio AI LLaMA per aiutare i ricercatori e affrontare ChatGPT

Nodo di origine: 1976707

Meta ha annunciato venerdì che rilascerà un nuovo modello linguistico basato sull'intelligenza artificiale mentre la corsa all'IA generativa si surriscalda, ha dichiarato venerdì il CEO Mark Zuckerberg. Il nuovo modello linguistico è destinato all'uso nella ricerca e sarà disponibile per i ricercatori accademici, il governo, la società civile e le organizzazioni accademiche e la ricerca industriale.

Il modello linguistico, chiamato LLaMA, è progettato per generare testo e conversazioni, riassumere materiale scritto ed eseguire compiti complicati come risolvere teoremi matematici o prevedere strutture proteiche. In un Facebook postale, Meta ha detto:

“Introduciamo LLaMA, una raccolta di modelli linguistici di base che vanno dai parametri 7B a 65B. Formiamo i nostri modelli su trilioni di token e dimostriamo che è possibile addestrare modelli all'avanguardia utilizzando esclusivamente set di dati pubblicamente disponibili, senza ricorrere a set di dati proprietari e inaccessibili. In particolare, LLaMA-13B supera GPT-3 (175B) nella maggior parte dei benchmark e LLaMA-65B è competitivo con i migliori modelli, Chinchilla70B e PaLM-540B. Rilasciamo tutti i nostri modelli alla comunità di ricerca.”

Sempre in un post su Twitter, il ricercatore di Facebook AI Research Guillaume Lample ha dichiarato:

“Oggi rilasciamo LLaMA, 4 modelli di base che vanno dai parametri 7B a 65B. LLaMA-13B supera OPT e GPT-3 175B nella maggior parte dei benchmark. LLaMA-65B è competitivo con Chinchilla 70B e PaLM 540B.”

Il ChatGPT è cresciuto in popolarità dopo il suo rilascio il 30 novembre 2022. Il chatbot basato sull'intelligenza artificiale di OpenAI potrebbe fare praticamente qualsiasi cosa, dallo scrivere poesie e correggere errori di codifica con esempi dettagliati, alla generazione di suggerimenti artistici AI. Può persino spiegare la complessità temporale nel caso peggiore dell'algoritmo di ordinamento delle bolle.

In soli due mesi, ChatGPT ha raggiunto i 100 milioni di utenti attivi mensili a gennaio, rendendola l'applicazione consumer con la crescita più rapida nella storia. La scorsa settimana, la società ha annunciato il lancio di ChatGPT Plus, un piano di abbonamento pilota da $ 20 al mese per il suo popolare chatbot basato sull'intelligenza artificiale. L'improvviso successo di ChatGPT ha messo sotto pressione altre società tecnologiche tra cui Google, Baidu e Alibaba.

ChatGPT è un'interfaccia di chat AI basata sul dialogo per la sua famiglia GPT-3 di modelli linguistici di grandi dimensioni. Lo strabiliante ChatGPT è un successore del Generative Pre-addestrato Transformer 3 (GPT-3), che è un modello di linguaggio autoregressivo che utilizza il deep learning per produrre testo simile a quello umano.

ChatGPT è stato adattato dal modello GPT-3.5 ma addestrato per fornire risposte più colloquiali. Tuttavia, a differenza del GPT-3, il nuovo ChatGPT dimostra una serie di nuove funzionalità, inclusa la capacità di impegnarsi in conversazioni con gli utenti, scrivere codici software, raccontare storie e fornire soluzioni a complesse equazioni matematiche. Il bello di tutto questo è che puoi provare tu stesso il nuovo chatbot proprio qui.

Di seguito è possibile scaricare una copia in formato PDF del Whitepaper LLaMA.

333078981_693988129081760_4712707815225756708_n

Timestamp:

Di più da TechStartup