Dolly 2.0: alternativa open source ChatGPT per uso commerciale

Dolly 2.0: alternativa open source ChatGPT per uso commerciale

Nodo di origine: 2599440

Dolly 2.0: alternativa open source ChatGPT per uso commerciale
Immagine dall'autore | Creatore di immagini Bing
 

carrello 2.0 è un modello di linguaggio di grandi dimensioni (LLM) open source, seguito da istruzioni, ottimizzato su un set di dati generato dall'uomo. Può essere utilizzato sia per scopi di ricerca che commerciali. 

 

Dolly 2.0: alternativa open source ChatGPT per uso commerciale
Immagine da Abbracciando Face Space di RamAnanth1
 

In precedenza, il team Databricks aveva rilasciato carrello 1.0, LLM, che offre istruzioni simili a ChatGPT seguendo le abilità e costa meno di $ 30 per la formazione. Stava utilizzando il set di dati del team Stanford Alpaca, che era soggetto a una licenza limitata (solo ricerca). 

Dolly 2.0 ha risolto questo problema perfezionando il modello linguistico dei parametri 12B (Pythia) su un'istruzione di alta qualità generata dall'uomo nel seguente set di dati, che è stata etichettata da un dipendente di Datbricks. Sia il modello che il set di dati sono disponibili per uso commerciale.

Dolly 1.0 è stato addestrato su un set di dati Stanford Alpaca, creato utilizzando l'API OpenAI. Il set di dati contiene l'output di ChatGPT e impedisce a chiunque di utilizzarlo per competere con OpenAI. In breve, non è possibile creare un chatbot commerciale o un’applicazione linguistica basata su questo set di dati. 

La maggior parte degli ultimi modelli rilasciati nelle ultime settimane soffrivano degli stessi problemi, modelli simili Alpaca, Koala, GPT4Tuttie Vicuna. Per aggirare il problema, dobbiamo creare nuovi set di dati di alta qualità che possano essere utilizzati per uso commerciale, ed è ciò che il team di Databricks ha fatto con il set di dati databricks-dolly-15k. 

Il nuovo set di dati contiene 15,000 coppie prompt/risposta etichettate da esseri umani di alta qualità che possono essere utilizzate per progettare istruzioni che mettono a punto modelli linguistici di grandi dimensioni. IL databricks-dolly-15k il set di dati viene fornito con Licenza Creative Commons Attribuzione-Condividi allo stesso modo 3.0 Unported, che consente a chiunque di utilizzarlo, modificarlo e creare un'applicazione commerciale su di esso. 

Come hanno creato il set di dati databricks-dolly-15k?

La ricerca OpenAI carta afferma che il modello InstructGPT originale è stato addestrato su 13,000 prompt e risposte. Utilizzando queste informazioni, il team di Databricks ha iniziato a lavorarci e si è scoperto che generare 13 domande e risposte era un compito difficile. Non possono utilizzare dati sintetici o dati generativi dell’intelligenza artificiale e devono generare risposte originali a ogni domanda. È qui che hanno deciso di utilizzare 5,000 dipendenti di Databricks per creare dati generati dall'uomo. 

I Databricks hanno organizzato un concorso in cui i migliori 20 etichettatori riceveranno un grande premio. A questo concorso hanno partecipato 5,000 dipendenti Databricks molto interessati ai LLM

Il dolly-v2-12b non è un modello all'avanguardia. Ha prestazioni inferiori a dolly-v1-6b in alcuni benchmark di valutazione. Potrebbe essere dovuto alla composizione e alle dimensioni dei set di dati di ottimizzazione sottostanti. La famiglia di modelli Dolly è in fase di sviluppo attivo, quindi in futuro potresti vedere una versione aggiornata con prestazioni migliori.  

In breve, il modello dolly-v2-12b ha funzionato meglio di EleutherAI/gpt-neox-20b e EleutherAI/pythia-6.9b.

 

Dolly 2.0: alternativa open source ChatGPT per uso commerciale
Immagine da Dolly gratis

Dolly 2.0 è open source al 100%. Viene fornito con codice di addestramento, set di dati, pesi del modello e pipeline di inferenza. Tutti i componenti sono adatti per l'uso commerciale. Puoi provare il modello su Hugging Face Spaces Dolly V2 di RamAnanth1.

 

Dolly 2.0: alternativa open source ChatGPT per uso commerciale
Immagine da Abbracciare il viso
 

Risorsa: 

Dimostrazione del carrello 2.0: Dolly V2 di RamAnanth1
 
 
Abid Ali Awan (@1abidaliawan) è un professionista di data scientist certificato che ama creare modelli di machine learning. Attualmente si sta concentrando sulla creazione di contenuti e sulla scrittura di blog tecnici sulle tecnologie di apprendimento automatico e scienza dei dati. Abid ha conseguito un Master in Technology Management e una laurea in Ingegneria delle Telecomunicazioni. La sua visione è quella di costruire un prodotto di intelligenza artificiale utilizzando una rete neurale grafica per studenti alle prese con malattie mentali.
 

Timestamp:

Di più da KDnuggets