ChatGPT incorporato nel robot, Internet teme la fine della civiltà

ChatGPT incorporato nel robot, Internet teme la fine della civiltà

Nodo di origine: 2611695

Un team di ricercatori di dottorandi dell'Arabia Saudita ha sviluppato un nuovo strumento basato sull'intelligenza artificiale, MiniGPT-4, che ha attributi simili a OpenAI di ChatGPT-4.

Dal ChatGPT è stato rilasciato a novembre ed è diventato un successo globale, gli sviluppatori non si sono fermati davanti a nulla per inventare nuovi strumenti di intelligenza artificiale che rivaleggiassero con il popolare chatbot o lo completassero.

MiniGPT-4, sviluppato utilizzando il modello ChatGPT, è solo l'ultimo esempio.

Leggi anche: Bill Gates: i chatbot basati sull'intelligenza artificiale potrebbero insegnare ai bambini a leggere in 18 mesi

Secondo Strumenti futuri, MiniGPT-4 è in grado di svolgere molte attività, tra cui la generazione di descrizioni di immagini e la creazione di siti Web.

"Questo strumento è in grado di generare descrizioni dettagliate delle immagini, creare siti Web da bozze scritte a mano, scrivere storie e poesie ispirate a determinate immagini, fornire soluzioni ai problemi mostrati nelle immagini e insegnare agli utenti come cucinare sulla base di foto di cibo", afferma Future Utensili.

Quando è stato rilasciato ChatGPT-4, è stato mostrato un video del modello che costruisce un sito Web da un'immagine di schizzo. Secondo un tweet di Barsee, MiniGPT-4 ha la capacità di realizzare la stessa impresa. L'unica differenza è che al momento ChatGPT-4 non è disponibile per tutti, mentre MiniGPT-4 è già disponibile.

Capire MiniGPT

Secondo gHacks, MiniGPT-4 utilizza un LLM avanzato chiamato Vicuna come decodificatore di lingua, che è basato su LLaMa e si dice che raggiunga il 90% della qualità di ChatGPT valutata da GPT-4.

Il modello AI ha utilizzato il componente pre-addestrato di Bootstrapping Language Image Pre-training (BLIP-2) e ha aggiunto un singolo strato di iniezione per allineare le caratteristiche visive codificate con il modello del linguaggio Vicuna congelando tutti gli altri componenti visivi e linguistici.

David Watson afferma che MiniGPT è leggero e può essere facilmente implementato in situazioni in tempo reale come chatbot, assistenti virtuali e sistemi automatici di sottotitoli delle immagini.

Elenca anche alcune possibili applicazioni che possono essere utili per MiniGPT-4: creazione di sistemi di sottotitoli per immagini che richiedono solo risorse leggere; e la descrizione dell'immagine per i non vedenti utilizzando la descrizione audio, un metodo che richiederebbe l'inclusione di un sistema di conversione del testo in audio.

Mentre OpenAI hanno confermato le capacità multimodali di GPT-4, devono ancora rilasciare le sue capacità di elaborazione delle immagini. MiniGPT-4 colma questa lacuna elaborando le immagini insieme al linguaggio utilizzando un LLM più sofisticato.

Uno strumento di intelligenza artificiale per aiutare la ricerca

Gli esperti affermano che il modello linguistico di base all'avanguardia utilizzato è progettato per aiutare i ricercatori a portare avanti il ​​loro lavoro in questo particolare segmento dell'IA.

Dato che OpenAI non ha rivelato molte informazioni sull'architettura, le dimensioni del modello, l'hardware, il calcolo dell'addestramento, la costruzione del set di dati o il metodo di addestramento di GPT-4, la natura open source di MiniGPT-4 potrebbe rivelarsi particolarmente preziosa per i ricercatori.

"La capacità di MiniGPT di elaborare le immagini offre ai ricercatori nuove opportunità per indagare sulla relazione tra linguaggio e modelli di visione", ha affermato Yana Khara, scrivendo per Analitica Vidhaya.

“Offrendo un modello più piccolo e più accessibile con cui i ricercatori possono lavorare, MiniGPT-4 può guidare l'innovazione e i progressi nella tecnologia AI.

"Inoltre, la base open source del modello assicura che la comunità di ricerca possa collaborare e condividere le proprie scoperte per ulteriori progressi nel campo".

MiniGPT porta i sottotitoli delle immagini a un altro livello

Barsee, che ha twittato un thread che descrive come MiniGPT-4 può essere utilizzato per chattare con le immagini, ha incluso alcuni dei seguenti casi:

Riparare oggetti rotti

Caricando un'immagine di un articolo rotto sulla piattaforma MiniGPT e chiedendo come risolvere la situazione nell'immagine, il chatbot spiegherà la situazione nell'immagine e suggerirà modi per risolvere i problemi identificati.

Nel Tweet, MiniGPT può facilmente identificare il problema, una lavatrice che perde, spiegando i motivi per cui potrebbe verificarsi la perdita e fornendo anche un elenco di soluzioni che l'utente potrebbe provare.

Scrivere pubblicità

In un altro tweet da Barsee nel thread MiniGPT, ha incluso uno scenario in cui a MiniGPT veniva data l'immagine di una tazza che l'utente produce e vende. L'utente chiede quindi al chatbot di scrivere un annuncio per commercializzare le tazze, cosa che il chatbot fa debitamente.

Brevi introduzioni

Carica semplicemente un'immagine di un film e chiedi a MiniGPT di darti una breve introduzione; produrrà quindi un paragrafo introduttivo del film in questione. Come si vede nel Tweet, il chatbot MiniGPT riconosce l'immagine da "Il padrino" e scrive un'introduzione del film come indicato.

Il mercato ha visto sviluppare innumerevoli nuovi strumenti di intelligenza artificiale dal lancio di ChatGPT. Ci sono più alternative al famoso chatbot con altri che, secondo quanto riferito, lo superano, non da ultimo GPT automatico, che sta ancora facendo scalpore nella comunità dell'IA. A questo ritmo, sembra quasi inevitabile che finiremo con l'imbarazzo della ricchezza di intelligenza artificiale praticamente per qualsiasi attività umana.

Timestamp:

Di più da MetaNotizie