Generatív ügynök kutatási dokumentumok, amelyeket érdemes elolvasni - KDnuggets

Generatív ügynök kutatási dokumentumok, amelyeket érdemes elolvasni – KDnuggets

Forrás csomópont: 2903173

Generatív ügynök kutatási dokumentumok, amelyeket érdemes elolvasni
Kép pikisuperstar on Freepik
 

A Generatív ügynökök kifejezést a Stanford Egyetem és a Google kutatói alkották meg az elnevezésű tanulmányukban Generatív ügynökök: Az emberi viselkedés interaktív szimulákra (Park et al., 2023). Ebben a tanulmányban a kutatás kifejti, hogy a generatív ügynökök olyan számítási szoftverek, amelyek hihetően szimulálják az emberi viselkedést. 

Az újságban bemutatják, hogyan viselkedhetnek az ágensek úgy, mint az emberek: írnak, főznek, beszélnek, szavaznak, alszanak stb., egy generatív modell, különösen a Large Language Model (LLM) megvalósításával. Az ágensek megmutathatják, hogy képesek következtetéseket levonni magukról, más ágensekről és környezetükről a természetes nyelvi modell felhasználásával.

A kutató rendszerarchitektúrát hoz létre a releváns emlékek tárolására, szintetizálására és alkalmazására, hogy hihető viselkedést generáljon egy nagy nyelvi modell segítségével, amely lehetővé teszi a generatív ágenseket. Ez a rendszer három összetevőből áll, ezek a következők:

  1. Memóriafolyam. A rendszer rögzíti az ügynök tapasztalatait, és referenciaként szolgál az ügynök jövőbeni tevékenységeihez.
  2. Visszaverődés. A rendszer a tapasztalatokat emlékekké szintetizálja, hogy az ügynök jobban tanuljon és jobban teljesítsen.
  3. Tervezés. A rendszer az előző rendszerből származó betekintést magas szintű cselekvési tervekké fordítja le, és lehetővé teszi az ügynök számára, hogy reagáljon a környezetre. 

Ezek a reflexiók és tervrendszerek szinergikusan működnek a memóriafolyammal, hogy befolyásolják az ügynök jövőbeli viselkedését. 

A fenti rendszer szimulálására a kutatók a Sims játék által ihletett ügynökök interaktív társadalmának létrehozására összpontosítanak. A fenti architektúra kapcsolódik a ChatGPT-hez, és sikeresen 25 ügynök interakciót jelenít meg a sandboxukon belül. Az alábbi képen látható egy példa az ügynök egész napos tevékenységére.

 

Generatív ügynök kutatási dokumentumok, amelyeket érdemes elolvasni
Generatív ügynök tevékenység és interakció egész nap (Park et al., 2023)
 

A generatív ügynökök létrehozásához és a homokozóban való szimulálásához szükséges teljes kódot a kutatók már nyílt forráskódúvá tették, amelyet az alábbiakban találhat meg. raktár. Az irány elég egyszerű ahhoz, hogy gond nélkül követhesd őket.

Mivel a generatív ügynökök izgalmas területté válnak, sok kutatás folyik ezen alapul. Ebben a cikkben a generatív ügynökök különféle tanulmányait fogjuk megvizsgálni, amelyeket érdemes elolvasnia. Mik ezek? Menjünk bele.

1. Kommunikációs ügynökök szoftverfejlesztéshez

A Kommunikációs ügynökök szoftverfejlesztéshez című dokumentum (Quan és mtsai., 2023) egy új megközelítés a szoftverfejlesztés forradalmasítására a Generative Agents segítségével. A kutatók azt javasolják, hogy a teljes szoftverfejlesztési folyamatot hogyan lehetne racionalizálni és egységesíteni a Large Language Models (LLM) természetes nyelvi kommunikációjával. A feladatok közé tartozik a kód fejlesztése, a dokumentumok generálása, a követelmények elemzése és még sok más.

A kutatók rámutatnak, hogy egy teljes szoftver létrehozása LLM segítségével két fő kihívással jár: a hallucinációkkal és a keresztkérdések hiányával a döntéshozatalban. E problémák megoldására a kutatók a ChatDev nevű chat-alapú szoftverfejlesztési keretrendszert javasolnak.

A ChatDev keretrendszer négy szakaszt követ: tervezés, kódolás, tesztelés és dokumentálás. A ChatDev minden fázisban több ügynököt hozott létre különböző szerepkörrel, például kódellenőröket, szoftverprogramozókat stb. Az ügynökök közötti kommunikáció zavartalan működése érdekében a kutatók egy chat-láncot fejlesztettek ki, amely a fázisokat szekvenciális atomi részfeladatokra osztotta. Minden részfeladat együttműködést és interakciót valósít meg az ügynökök között.

A ChatDev keretrendszer az alábbi képen látható.

 

Generatív ügynök kutatási dokumentumok, amelyeket érdemes elolvasni
A javasolt ChatDev-keretrendszer (Quan és mtsai., 2023)
 

A kutatók különféle kísérletekkel mérik fel, hogyan teljesít a ChatDev keretrendszer a szoftverfejlesztésben. Használva gpt3.5-turbo-16k, alább látható a szoftverstatisztikai kísérlet teljesítménye.

 

Generatív ügynök kutatási dokumentumok, amelyeket érdemes elolvasni
A ChatDev keretrendszer szoftverstatisztikái (Quan és mtsai., 2023)
 

A fenti szám a ChatDev által generált szoftverrendszerek statisztikai elemzésének mérőszáma. Például a rendszer legalább 39 kódsort generál, a maximum pedig 359 kódot. A kutatók azt is kimutatták, hogy a létrehozott szoftverrendszerek 86.66%-a megfelelően működött.

Ez egy nagyszerű dokumentum, amely bemutatja a fejlesztők munkájának megváltoztatásának lehetőségét. Olvassa el a cikket tovább, hogy megértse a ChatDev teljes megvalósítását. A teljes kód a ChatDevben is elérhető raktár.

2. AgentVerse: Több ügynök együttműködésének elősegítése és az ügynökökben felmerülő viselkedések feltárása

Az AgentVerse egy olyan keretrendszer, amelyet a cikkben javasolt Chen et al., 2023 az ágenscsoportok szimulálása a Large Language Model segítségével a csoporton belüli dinamikus problémamegoldó eljárásokhoz és a csoporttagok előrehaladás alapján történő beállításához. Ez a tanulmány a statikus csoportdinamika kihívásának megoldására szolgál, ahol az autonóm ágens nem tud alkalmazkodni és fejlődni a problémák megoldásában.

Az AgentVerse keretrendszer négy lépésre próbálja felosztani a keretrendszert, beleértve: 

  1. Szakértői toborzás: Az ügynökök alkalmazkodási szakasza, hogy igazodjanak a problémához és a megoldáshoz
  2. Együttműködő döntéshozatal: Az ügynökök megbeszélik, hogy megoldást és stratégiát dolgozzanak ki a probléma megoldására. 
  3. Művelet végrehajtása: Az ügynökök a döntés alapján hajtanak végre cselekvést a környezetben.
  4. Értékelés: Az aktuális állapot és a célok értékelése megtörténik. A visszajelzési jutalom visszatér az első lépéshez, ha a célt még teljesíteni kell.

Az AgentVerse általános felépítése az alábbi képen látható.

 

Generatív ügynök kutatási dokumentumok, amelyeket érdemes elolvasni
AgentVerse Framework (Chen és mtsai., 2023)
 

A kutatók kísérleteztek a keretrendszerrel, és összehasonlították az AgentVerse keretrendszert az egyedi ügynöki megoldással. Az eredmény az alábbi képen látható.

 

Generatív ügynök kutatási dokumentumok, amelyeket érdemes elolvasni
Az AgentVerse teljesítményelemzése (Chen és mtsai., 2023)
 

Az AgentVerse keretrendszer általában felülmúlja az egyes ügynököket az összes bemutatott feladatban. Ez azt bizonyítja, hogy a generatív ágensek jobban teljesítenek, mint a problémák megoldására törekvő egyéni ágensek. Kipróbálhatnád a keretrendszert rajtuk keresztül raktár.

3. AgentSims: Nyílt forráskódú homokozó a nagy nyelvi modellek értékeléséhez

Az LLM-ek képességeinek értékelése továbbra is nyitott kérdés a közösségen és a szakterületeken belül. Három pont, amely korlátozza az LLM megfelelő értékelésének képességét: a feladatok által korlátozott értékelési képességek, a sebezhető benchmarkok és a nem objektív mérőszámok. E problémák kezeléséhez Lin és mtsai., 2023 feladatalapú értékelést javasoltak LLM-benchmarkként dolgozatukban. Ez a megközelítés azt remélte, hogy szabványossá válik az LLM munkáinak értékelésében, mivel ez enyhítheti az összes felmerült problémát. Ennek elérése érdekében a kutatók bevezetik az AgentSims nevű keretrendszert.

Az AgentSims egy olyan program, amely interaktív és vizualizációs infrastruktúrával rendelkezik az LLM-ek értékelési feladatainak gondozására. Az AgentSims átfogó célja, hogy a kutatók és szakértők számára platformot biztosítson a feladattervezési folyamat egyszerűsítéséhez és értékelési eszközként való használatához. Az AgentSims eleje az alábbi képen látható.

 

Generatív ügynök kutatási dokumentumok, amelyeket érdemes elolvasni
AgentSims kezelőfelület (Lin és mtsai., 2023)
 

Mivel az AgentSims célpontja mindenki, aki egyszerűbb módokon igényel LLM-értékelést, a kutatók kifejlesztették azt a kezelőfelületet, ahol interakcióba léphetünk a felhasználói felülettel. A teljes demót is kipróbálhatod rajtuk vagy elérheti a teljes kódot az AgentSimsben raktár.

A generatív ágensek egy újabb megközelítés az LLM-ekben az emberi viselkedés szimulálására. Park legújabb kutatása et al., 2023 nagyszerű lehetőséget mutatott arra, hogy mit tehetnek a Generatív Ügynökök. Ezért jelent meg sokféle, a generatív ágenseken alapuló kutatás, és sok új ajtót nyitott meg.

Ebben a cikkben három különböző generatív ágens-kutatásról beszéltünk, többek között:

  1. Kommunikációs ügynökök szoftverfejlesztéshez papír (mikor és mtsai., 2023)
  2. AgentVerse: Több ügynök együttműködésének elősegítése és az ügynökök felbukkanó viselkedéseinek feltárása (Chen et al., 2023)

3. AgentSims: nyílt forráskódú homokozó a nagy nyelvi modellek értékeléséhez (Lin és mtsai., 2023)
 
 
Cornelius Yudha Wijaya adattudományi asszisztens menedzser és adatíró. Miközben teljes munkaidőben dolgozik az Allianz Indonesia-nál, szeret Python és Data tippeket megosztani a közösségi médián és az írási médián keresztül.
 

Időbélyeg:

Még több KDnuggets