ChatGPT Embedded in Robot, Internet Fears End of Civilization

ChatGPT Embedded in Robot, Internet Fears End of Civilization

Kilde node: 2611695

Et team av doktorgradsstudenter fra Saudi-Arabia har utviklet et nytt AI-drevet verktøy, MiniGPT-4, som har lignende egenskaper som OpenAI ChatGPT-4.

Siden ChatGPT ble utgitt i november og ble en global hit, har utviklere ikke stoppet noe for å komme opp med nye AI-verktøy som enten konkurrerer med den populære chatboten eller utfyller den.

MiniGPT-4, utviklet ved hjelp av ChatGPT-modellen, er bare det siste eksemplet.

Les også: Bill Gates: AI Chatbots kunne lære barn å lese på 18 måneder

Ifølge Fremtidige verktøy, MiniGPT-4 er i stand til mange oppgaver, inkludert generering av bildebeskrivelser og bygging av nettsteder.

"Dette verktøyet er i stand til å generere detaljerte bildebeskrivelser, lage nettsider fra håndskrevne utkast, skrive historier og dikt inspirert av gitte bilder, gi løsninger på problemer vist i bilder, og lære brukere å lage mat basert på matbilder," hevder Future Verktøy.

Da ChatGPT-4 ble utgitt, ble det vist en video av modellen som bygger et nettsted fra et skissebilde. Ifølge en tweet av Barsee, MiniGPT-4 har muligheten til å utføre samme bragd. Den eneste forskjellen er at ChatGPT-4 ikke er tilgjengelig for alle for øyeblikket, mens MiniGPT-4 allerede er i naturen.

Forstå MiniGPT

Ifølge Ghacks, MiniGPT-4 bruker en avansert LLM kalt Vicuna som språkdekoder, som er bygget på LLaMa og rapporteres å oppnå 90 % av ChatGPTs kvalitet som evaluert av GPT-4.

AI-modellen har brukt den forhåndstrente komponenten til Bootstrapping Language Image Pre-training (BLIP-2) og har lagt til et enkelt injeksjonslag for å justere de kodede visuelle funksjonene med Vicuna-språkmodellen ved å fryse alle andre syns- og språkkomponenter.

David Watson sier MiniGPT er lett og enkelt kan implementeres i sanntidssituasjoner som chatbots, virtuelle assistenter og automatiserte bildetekstsystemer.

Han lister også opp noen mulige applikasjoner som kan være en god bruk for MiniGPT-4: lage bildetekstsystemer som bare krever lette ressurser; og bildebeskrivelse for synshemmede ved bruk av lydbeskrivelse, en metode som vil kreve å inkludere et tekst-til-lyd-system.

Samtidig som OpenAI bekreftet GPT-4s multimodale evner, har de ennå ikke frigitt dens bildebehandlingsevne. MiniGPT-4 fyller dette gapet ved å behandle bilder sammen med språk ved å bruke en mer sofistikert LLM.

Et AI-verktøy for å hjelpe forskning

Eksperter sier at den avanserte grunnleggende språkmodellen som brukes, er designet for å hjelpe forskere med å fremme arbeidet sitt i dette bestemte AI-segmentet.

Gitt at OpenAI ikke har avslørt mye informasjon om GPT-4s arkitektur, modellstørrelse, maskinvare, treningsberegning, datasettkonstruksjon eller opplæringsmetode, kan MiniGPT-4s åpen kildekode vise seg å være spesielt verdifull for forskere.

"MiniGPTs evne til å behandle bilder gir forskere nye muligheter til å undersøke forholdet mellom språk- og synsmodeller," sa Yana Khara, som skrev for Analytics Vidhaya.

"Ved å tilby en mindre, mer tilgjengelig modell for forskere å jobbe med, kan MiniGPT-4 drive innovasjon og fremskritt innen AI-teknologi.

"I tillegg sikrer modellens åpen kildekode-fundament at forskningsmiljøet kan samarbeide og dele sine funn for videre fremgang på feltet."

MiniGPT tar bildeteksting til et annet nivå

Barsee, som twitret en tråd som beskrev hvordan MiniGPT-4 kan brukes til å chatte med bilder, inkluderte noen av følgende tilfeller:

Retting av ødelagte gjenstander

Ved å laste opp et bilde av et ødelagt element til MiniGPT-plattformen og spørre hvordan du kan fikse situasjonen i bildet, vil chatboten forklare situasjonen i bildet og foreslå måter å fikse problemene på.

kvitring, MiniGPT kan enkelt identifisere problemet, en lekker vaskemaskin, forklare årsakene til at lekkasjen kan skje og også gi en liste over løsninger brukeren kan prøve.

Skrive annonser

I en annen tweet fra Barsee i MiniGPT-tråden inkluderte han et scenario der MiniGPT fikk et bilde av et krus brukeren lager og selger. Brukeren ber deretter chatboten om å skrive en annonse for å markedsføre krusene, noe chatboten behørig gjør.

Korte introduksjoner

Bare last opp et bilde av en film og be MiniGPT om å gi deg en kort introduksjon; den vil da produsere en avsnittsintroduksjon av den aktuelle filmen. Som sett i kvitring, MiniGPT chatbot gjenkjenner bildet fra "The Godfather" og skriver en intro av filmen som instruert.

Markedet har sett utallige nye AI-verktøy utviklet siden ChatGPT ble lansert. Det finnes flere alternativer til den kjente chatboten med andre som angivelig overgår den, ikke minst Auto-GPT, som fortsatt skaper bølger i AI-samfunnet. Med denne hastigheten virker det nesten uunngåelig at vi ender opp med en forlegenhet av AI-rikdom for praktisk talt enhver menneskelig oppgave.

Tidstempel:

Mer fra MetaNews