Robotba ágyazott ChatGPT, az Internet a civilizáció végétől fél

Robotba ágyazott ChatGPT, az Internet a civilizáció végétől fél

Forrás csomópont: 2611695

Egy szaúd-arábiai PhD hallgató kutatócsoport kifejlesztett egy új mesterséges intelligenciával hajtott eszközt, a MiniGPT-4-et, amely hasonló tulajdonságokkal rendelkezik OpenAI-k ChatGPT-4.

Óta ChatGPT novemberben jelent meg, és globális slágerré vált, a fejlesztők semmit sem álltak meg, hogy új mesterséges intelligencia-eszközökkel rukkoljanak elő, amelyek vagy vetekednek a népszerű chatbottal, vagy kiegészítik azt.

A ChatGPT modell segítségével kifejlesztett MiniGPT-4 csak a legújabb példa.

Lásd még: Bill Gates: Az AI chatbotok 18 hónap alatt megtaníthatják a gyerekeket olvasni

Szerint Jövő eszközei, a MiniGPT-4 számos feladatra képes, beleértve a képleírások generálását és a webhelyek létrehozását.

"Ez az eszköz képes részletes képleírások generálására, weboldalak létrehozására kézzel írott piszkozatokból, történetek és versek írására adott képek ihlette, megoldásokat kínál a képeken látható problémákra, és megtanítja a felhasználókat ételfotók alapján főzni" - állítja a Future. Eszközök.

Amikor a ChatGPT-4 megjelent, egy videót mutattak be a modellről, amely egy vázlatos képből weboldalt épített. Egy tweet szerint Barsee, A MiniGPT-4 képes ugyanarra a teljesítményre. Az egyetlen különbség az, hogy a ChatGPT-4 jelenleg nem mindenki számára elérhető, míg a MiniGPT-4 már a vadonban van.

A MiniGPT megértése

Szerint GhacksA MiniGPT-4 a Vicuna nevű fejlett LLM-et használja nyelvi dekódolóként, amely a LLaMa-ra épül, és a jelentések szerint a GPT-90 által kiértékelt ChatGPT minőségének 4%-át eléri.

Az AI-modell a Bootstrapping Language Image Pre-training (BLIP-2) előre betanított összetevőjét használta, és egyetlen befecskendezési réteget adott hozzá, hogy a kódolt vizuális jellemzőket a Vicuna nyelvi modellhez igazítsa az összes többi látás- és nyelvi összetevő lefagyasztásával.

David Watson szerint a MiniGPT könnyű, és könnyen megvalósítható valós idejű helyzetekben, például chatbotokban, virtuális asszisztensekben és automatikus képaláírási rendszerekben.

Felsorol néhány lehetséges alkalmazást is, amelyek jó hasznát vehetik a MiniGPT-4-nek: olyan képaláírási rendszerek létrehozása, amelyek csak könnyű erőforrásokat igényelnek; és képleírás látássérültek számára hangos leírás segítségével, amely módszerhez szöveg-audió rendszerre lenne szükség.

Míg OpenAI megerősítette a GPT-4 multimodális képességeit, de még nem engedték el a képfeldolgozási képességeit. A MiniGPT-4 ezt a hiányt pótolja azzal, hogy a képeket a nyelv mellett egy kifinomultabb LLM segítségével dolgozza fel.

A kutatást segítő AI-eszköz

A szakértők szerint az alkalmazott legkorszerűbb alapozó nyelvi modellt arra tervezték, hogy segítse a kutatókat munkájuk előmozdításában ebben a speciális AI-szegmensben.

Tekintettel arra, hogy az OpenAI nem közölt sok információt a GPT-4 architektúrájáról, a modell méretéről, a hardverről, a képzési számításokról, az adatkészlet felépítéséről vagy a képzési módszerről, a MiniGPT-4 nyílt forráskódú természete különösen értékes lehet a kutatók számára.

"A MiniGPT képfeldolgozási képessége új lehetőségeket kínál a kutatóknak a nyelv és a látásmodellek közötti kapcsolat vizsgálatára" - mondta Yana Khara, a Analytics Vidhaya.

„Azáltal, hogy a MiniGPT-4 egy kisebb, könnyebben elérhető modellt kínál a kutatók számára, az innovációt és az AI-technológia fejlődését ösztönözheti.

"Továbbá a modell nyílt forráskódú alapja biztosítja, hogy a kutatói közösség együttműködhessen és megosszák eredményeiket a területen való további fejlődés érdekében."

A MiniGPT egy újabb szintre emeli a képaláírást

Barsee, aki tweetelt egy szálat, amely leírja, hogy a MiniGPT-4 hogyan használható képekkel való csevegésre, a következő esetek közül néhányat tartalmazott:

Törött tárgyak javítása

Ha feltölt egy képet egy törött elemről a MiniGPT platformra, és megkérdezi, hogyan tudná javítani a képen látható helyzetet, a chatbot elmagyarázza a képen látható helyzetet, és javaslatokat tesz az azonosított problémák megoldására.

A csipog, A MiniGPT könnyen azonosítja a problémát, a szivárgó mosógépet, elmagyarázza a szivárgás okait, és felsorolja azokat a megoldásokat, amelyeket a felhasználó kipróbálhat.

Reklámok írása

Egy másikban tweet Barsee-től a MiniGPT szálon egy olyan forgatókönyvet írt be, ahol a MiniGPT kapott egy képet a felhasználó által gyártott és eladott bögréről. A felhasználó ezután megkéri a chatbotot, hogy írjon hirdetést a bögrék forgalmazására, amit a chatbot megfelelően meg is tesz.

Rövid bemutatkozások

Egyszerűen tölts fel egy képet egy filmről, és kérd meg a MiniGPT-t, hogy tartson rövid bemutatkozást; majd elkészíti a szóban forgó film bevezetőjét. Amint az a csipog, a MiniGPT chatbot felismeri a „The Godfather” képét, és az utasításoknak megfelelően bevezetőt ír a filmhez.

A piac számtalan új AI-eszközt fejlesztett ki a ChatGPT indulása óta. A híres chatbotnak több alternatívája is van, és a hírek szerint nem utolsósorban mások is megelőzik azt Auto-GPT, ami még mindig hullámokat ver az AI közösségben. Ilyen ütemben szinte elkerülhetetlennek tűnik, hogy gyakorlatilag bármilyen emberi feladathoz kínos mesterségesintelligencia-vagyonnal járjunk.

Időbélyeg:

Még több MetaNews