Entusiasmante efficienza dell'intelligenza artificiale: la fusione di modelli più piccoli supera le controparti più grandi

Entusiasmante efficienza dell'intelligenza artificiale: la fusione di modelli più piccoli supera le controparti più grandi

Nodo di origine: 3069830

In recent years, the field of conversational AI has been significantly influenced by models like ChatGPT, characterized by their expansive parameter sizes. However, this approach comes with substantial demands on computational resources and memory. A study now introduces a novel concept: blending multiple smaller AI models to achieve or surpass the performance of larger models. This approach, termed “Blending,” Integra molteplici IA di chat, offrendo una soluzione efficace alle sfide computazionali di modelli di grandi dimensioni.

La ricerca, condotta nell’arco di trenta giorni con un’ampia base di utenti sulla piattaforma di ricerca Chai, mostra che la combinazione di specifici modelli più piccoli può potenzialmente sovraperformare o eguagliare le capacità di modelli molto più grandi, come ChatGPT. Ad esempio, l'integrazione di soli tre modelli con parametri 6B/13B può rivaleggiare o addirittura superare i parametri prestazionali di modelli sostanzialmente più grandi come ChatGPT con parametri 175B+.

La crescente dipendenza da modelli linguistici di grandi dimensioni (LLM) pre-addestrati per diverse applicazioni, in particolare nella chat AI, ha portato a un’impennata nello sviluppo di modelli con un numero enorme di parametri. Tuttavia, questi modelli di grandi dimensioni richiedono infrastrutture specializzate e comportano notevoli spese generali di inferenza, che ne limitano l’accessibilità. L’approccio Blended, invece, offre un’alternativa più efficiente senza compromettere la qualità della conversazione.

L’efficacia dell’intelligenza artificiale mista è evidente nel coinvolgimento degli utenti e nei tassi di fidelizzazione. Durante i test A/B su larga scala sulla piattaforma CHAI, gli ensemble misti, composti da tre LLM con parametri 6-13B, hanno superato il parametro ChatGPT da 175B+ di OpenAI, ottenendo fidelizzazione e coinvolgimento degli utenti significativamente più elevati. Ciò indica che gli utenti hanno trovato le IA della chat mista più coinvolgenti, divertenti e utili, il tutto richiedendo solo una frazione del costo di inferenza e del sovraccarico di memoria dei modelli più grandi.

La metodologia dello studio prevede un assemblaggio basato su principi statistici bayesiani, in cui la probabilità di una particolare risposta è concettualizzata come un’aspettativa marginale presa su tutti i parametri plausibili dell’intelligenza artificiale della chat. Blended seleziona in modo casuale l'IA della chat che genera la risposta corrente, consentendo a diverse IA della chat di influenzare implicitamente l'output. Ciò si traduce in una fusione dei punti di forza dell’intelligenza artificiale della chat individuale, portando a risposte più accattivanti e diversificate.

Le innovazioni nelle tendenze dell’intelligenza artificiale e dell’apprendimento automatico per il 2024 sottolineano il passaggio verso modelli di intelligenza artificiale più pratici, efficienti e personalizzabili. Man mano che l’intelligenza artificiale diventa sempre più integrata nelle operazioni aziendali, c’è una crescente domanda di modelli che soddisfino esigenze specifiche, offrendo maggiore privacy e sicurezza. Questo cambiamento è in linea con i principi fondamentali dell’approccio misto, che enfatizza l’efficienza, il rapporto costo-efficacia e l’adattabilità.

In conclusione, il metodo Blended rappresenta un passo significativo nello sviluppo dell’IA. Combinando più modelli più piccoli, offre una soluzione efficiente ed economica che mantiene e, in alcuni casi, migliora il coinvolgimento e la fidelizzazione degli utenti rispetto ai modelli più grandi e ad alta intensità di risorse. Questo approccio non solo affronta i limiti pratici delle IA su larga scala, ma apre anche nuove possibilità per le applicazioni dell’IA in vari settori.

Fonte immagine: Shutterstock

Timestamp:

Di più da News di Blockchain