ChatGPT Embedded in Robot, Internet Fears End of Civilization

ChatGPT Embedded in Robot, Internet Fears End of Civilization

Kildeknude: 2611695

Et hold ph.d.-studerende forskere fra Saudi-Arabien har udviklet et nyt AI-drevet værktøj, MiniGPT-4, som har lignende egenskaber som OpenAI'er ChatGPT-4.

Siden ChatGPT blev udgivet i november og blev et globalt hit, har udviklere ikke stoppet noget for at komme med nye AI-værktøjer, der enten konkurrerer med den populære chatbot eller supplerer den.

MiniGPT-4, udviklet ved hjælp af ChatGPT-modellen, er blot det seneste eksempel.

Læs også: Bill Gates: AI Chatbots kunne lære børn at læse på 18 måneder

Ifølge Fremtidige værktøjer, MiniGPT-4 er i stand til mange opgaver, herunder billedbeskrivelsesgenereringer og opbygning af websteder.

"Dette værktøj er i stand til at generere detaljerede billedbeskrivelser, skabe hjemmesider ud fra håndskrevne udkast, skrive historier og digte inspireret af givne billeder, give løsninger på problemer vist i billeder og lære brugerne at lave mad baseret på madfotos," hævder Future Værktøjer.

Da ChatGPT-4 blev udgivet, blev der vist en video af modellen, der bygger en hjemmeside ud fra et skitsebillede. Ifølge et tweet af Barsee, MiniGPT-4 har evnen til at udføre den samme bedrift. Den eneste forskel er, at ChatGPT-4 ikke er tilgængelig for alle i øjeblikket, mens MiniGPT-4 allerede er i naturen.

Forstå MiniGPT

Ifølge Ghacks, MiniGPT-4 bruger en avanceret LLM kaldet Vicuna som sprogdekoder, som er bygget på LLaMa og rapporteres at opnå 90% af ChatGPT's kvalitet som evalueret af GPT-4.

AI-modellen har brugt den fortrænede komponent af Bootstrapping Language Image Pre-training (BLIP-2) og har tilføjet et enkelt injektionslag for at justere de kodede visuelle funktioner med Vicuna-sprogmodellen ved at fryse alle andre syns- og sprogkomponenter.

David Watson siger, at MiniGPT er let og nemt kan implementeres i realtidssituationer som chatbots, virtuelle assistenter og automatiserede billedtekstsystemer.

Han lister også et par mulige applikationer, der kan være en god brug for MiniGPT-4: at skabe billedtekstsystemer, der kun kræver lette ressourcer; og billedbeskrivelse for synshandicappede ved hjælp af lydbeskrivelse, en metode som ville kræve at inkludere et tekst-til-lyd-system.

Mens OpenAI bekræftede GPT-4's multimodale muligheder, har de endnu ikke frigivet dens billedbehandlingsevner. MiniGPT-4 udfylder dette hul ved at behandle billeder sammen med sprog ved hjælp af en mere sofistikeret LLM.

Et AI-værktøj til at hjælpe forskning

Eksperter siger, at den avancerede grundlæggende sprogmodel, der bruges, er designet til at hjælpe forskere med at fremme deres arbejde i dette særlige AI-segment.

I betragtning af at OpenAI ikke har afsløret meget information om GPT-4's arkitektur, modelstørrelse, hardware, træningsberegning, datasætkonstruktion eller træningsmetode, kan MiniGPT-4's open source-karakter vise sig at være særlig værdifuld for forskere.

"MiniGPTs evne til at behandle billeder giver forskere nye muligheder for at undersøge forholdet mellem sprog og synsmodeller," sagde Yana Khara, der skrev for Analytics Vidhaya.

"Ved at tilbyde en mindre, mere tilgængelig model for forskere at arbejde med, kan MiniGPT-4 drive innovation og fremskridt inden for AI-teknologi.

"Desuden sikrer modellens open source-fundament, at forskningssamfundet kan samarbejde og dele deres resultater for at gøre fremskridt på området."

MiniGPT tager billedtekstning til et andet niveau

Barsee, der tweetede en tråd, der beskriver, hvordan MiniGPT-4 kan bruges til at chatte med billeder, inkluderede nogle af følgende tilfælde:

Reparation af ødelagte genstande

Ved at uploade et billede af en ødelagt genstand til MiniGPT-platformen og spørge, hvordan du kan rette situationen på billedet, vil chatbotten forklare situationen på billedet og foreslå måder at løse de identificerede problemer på.

I tweet, MiniGPT kan nemt identificere problemet, en utæt vaskemaskine, forklare årsagerne til, hvorfor lækagen kunne ske, og også give en liste over løsninger, som brugeren kan prøve.

Skrive annoncer

I en anden tweet fra Barsee i MiniGPT-tråden inkluderede han et scenarie, hvor MiniGPT fik et billede af et krus, som brugeren fremstiller og sælger. Brugeren beder derefter chatbotten om at skrive en annonce for at markedsføre krusene, hvilket chatbotten behørigt gør.

Korte introduktioner

Du skal blot uploade et billede af en film og bede MiniGPT om at give dig en kort introduktion; det vil derefter producere en paragrafintroduktion af den pågældende film. Som det ses i tweet, MiniGPT chatbot genkender billedet fra "The Godfather" og skriver en intro til filmen som anvist.

Markedet har set utallige nye AI-værktøjer udviklet, siden ChatGPT blev lanceret. Der er flere alternativer til den berømte chatbot, hvor andre efter sigende overgår den, ikke mindst Auto-GPT, som stadig laver bølger i AI-fællesskabet. Med denne hastighed virker det næsten uundgåeligt, at vi ender med en forlegenhed af AI-rigdomme til stort set enhver menneskelig opgave.

Tidsstempel:

Mere fra MetaNews