ChatGPT inbäddad i robot, Internet fruktar slutet på civilisationen

ChatGPT inbäddad i robot, Internet fruktar slutet på civilisationen

Källnod: 2611695

Ett team av doktorandforskare från Saudiarabien har utvecklat ett nytt AI-drivet verktyg, MiniGPT-4, som har liknande egenskaper som OpenAI s ChatGPT-4.

Eftersom ChatGPT släpptes i november och blev en global hit, utvecklare har inte stannat för något för att komma med nya AI-verktyg som antingen konkurrerar med den populära chatboten eller kompletterar den.

MiniGPT-4, utvecklad med ChatGPT-modellen, är bara det senaste exemplet.

Läs också: Bill Gates: AI Chatbots kunde lära barn att läsa på 18 månader

Enligt Framtida verktyg, MiniGPT-4 kan utföra många uppgifter, inklusive bildbeskrivningsgenerering och att bygga webbplatser.

"Det här verktyget kan generera detaljerade bildbeskrivningar, skapa webbplatser från handskrivna utkast, skriva berättelser och dikter inspirerade av givna bilder, tillhandahålla lösningar på problem som visas i bilder och lära användarna hur man lagar mat baserat på matfoton", hävdar Future Verktyg.

När ChatGPT-4 släpptes visades en video av modellen som bygger en webbplats från en skissbild. Enligt en tweet av Barsee, MiniGPT-4 har förmågan att göra samma bedrift. Den enda skillnaden är att ChatGPT-4 inte är tillgängligt för alla för närvarande, medan MiniGPT-4 redan finns i naturen.

Förstå MiniGPT

Enligt Ghacks, MiniGPT-4 använder en avancerad LLM som heter Vicuna som språkavkodare, som är byggd på LLaMa och rapporteras uppnå 90 % av ChatGPTs kvalitet som utvärderats av GPT-4.

AI-modellen har använt den förtränade komponenten av Bootstrapping Language Image Pre-training (BLIP-2) och har lagt till ett enda injektionsskikt för att anpassa de kodade visuella funktionerna med Vicuna-språkmodellen genom att frysa alla andra syn- och språkkomponenter.

David Watson säger att MiniGPT är lätt och enkelt kan implementeras i realtidssituationer som chatbots, virtuella assistenter och automatiska bildtextningssystem.

Han listar också några möjliga applikationer som kan vara en bra användning för MiniGPT-4: skapa bildtextningssystem som bara kräver lätta resurser; och bildbeskrivning för synskadade med hjälp av ljudbeskrivning, en metod som skulle kräva inkludering av ett text-till-ljud-system.

Medan OpenAI bekräftade GPT-4:s multimodala kapacitet, de har ännu inte släppt dess bildbehandlingsförmåga. MiniGPT-4 fyller detta tomrum genom att bearbeta bilder tillsammans med språk med en mer sofistikerad LLM.

Ett AI-verktyg för att underlätta forskning

Experter säger att den toppmoderna grundläggande språkmodellen som används är utformad för att hjälpa forskare att utveckla sitt arbete inom just detta AI-segment.

Med tanke på att OpenAI inte har avslöjat mycket information om GPT-4:s arkitektur, modellstorlek, hårdvara, träningsberäkning, datauppsättningskonstruktion eller träningsmetod, kan MiniGPT-4:s natur med öppen källkod visa sig vara särskilt värdefull för forskare.

"MiniGPT:s förmåga att bearbeta bilder ger forskare nya möjligheter att undersöka sambandet mellan språk och synmodeller", säger Yana Khara, som skriver för Analytics Vidhaya.

"Genom att erbjuda en mindre, mer tillgänglig modell för forskare att arbeta med, kan MiniGPT-4 driva innovation och framsteg inom AI-teknik.

"Dessutom säkerställer modellens öppen källkod att forskarvärlden kan samarbeta och dela sina resultat för att göra ytterligare framsteg på området."

MiniGPT tar bildtextning till en annan nivå

Barsee, som twittrade en tråd som beskrev hur MiniGPT-4 kan användas för att chatta med bilder, inkluderade några av följande fall:

Fixar trasiga föremål

Genom att ladda upp en bild av ett trasigt föremål till MiniGPT-plattformen och fråga hur du kan fixa situationen i bilden, kommer chatboten att förklara situationen i bilden och föreslå sätt att åtgärda de identifierade problemen.

I tweeta, MiniGPT kan enkelt identifiera problemet, en läckande tvättmaskin, förklara orsakerna till varför läckan kan inträffa och även tillhandahålla en lista med lösningar som användaren kan prova.

Skriver annonser

I en annan tweet från Barsee i MiniGPT-tråden inkluderade han ett scenario där MiniGPT fick en bild på en mugg som användaren tillverkar och säljer. Användaren ber sedan chatboten att skriva en annons för att marknadsföra muggarna, vilket chatboten vederbörligen gör.

Korta introduktioner

Ladda bara upp en bild på en film och be MiniGPT att ge dig en kort introduktion; det kommer sedan att producera en styckeintroduktion av filmen i fråga. Som framgår av tweeta, MiniGPT-chatboten känner igen bilden från "The Godfather" och skriver ett intro till filmen enligt instruktionerna.

Marknaden har sett otaliga nya AI-verktyg utvecklade sedan ChatGPT lanserades. Det finns fler alternativ till den berömda chatboten med andra som enligt uppgift överträffar den, inte minst Auto-GPT, som fortfarande gör vågor i AI-gemenskapen. I den här takten verkar det nästan oundvikligt att vi kommer att sluta med en skam av AI-rikedomar för praktiskt taget alla mänskliga uppgifter.

Tidsstämpel:

Mer från MetaNews