Generatiivse agenti uurimistööd, mida peaksite lugema – KDnuggets

Generatiivse agenti uurimistööd, mida peaksite lugema – KDnuggets

Allikasõlm: 2903173

Generatiivagendi uurimistööd, mida peaksite lugema
Image by pikasuperstaar on Freepik
 

Generatiivsed agendid on termin, mille lõid Stanfordi ülikool ja Google'i teadlased oma artiklis nimega Generatiivsed ained: inimkäitumise interaktiivsed simulaakrid (Park et al., 2023). Selles artiklis selgitatakse uuringus, et generatiivsed agendid on arvutustarkvara, mis simuleerib usutavalt inimese käitumist. 

Artiklis tutvustatakse, kuidas agendid saaksid toimida nii, nagu inimesed teeksid: kirjutades, küpsetades, rääkides, hääletades, magades jne, rakendades generatiivset mudelit, eriti suure keele mudelit (LLM). Agendid võivad loomulikku keelemudelit kasutades näidata võimet teha järeldusi enda, teiste agentide ja oma keskkonna kohta.

Teadlane konstrueerib süsteemiarhitektuuri asjakohaste mälestuste salvestamiseks, sünteesimiseks ja rakendamiseks, et luua usutavat käitumist suure keelemudeli abil, võimaldades generatiivseid agente. See süsteem koosneb kolmest komponendist, need on:

  1. Mälu voog. Süsteem salvestab agendi kogemused ja on võrdlusaluseks agendi edasistele tegevustele.
  2. Peegeldus. Süsteem sünteesib kogemuse mälestusteks, et agent saaks õppida ja paremini toimida.
  3. Planeerimine. Süsteem teisendab eelmisest süsteemist saadud ülevaate kõrgetasemelisteks tegevusplaanideks ja võimaldab agendil reageerida keskkonnale. 

Need peegeldused ja plaanisüsteemid töötavad sünergiliselt mäluvooga, et mõjutada agendi edasist käitumist. 

Ülaltoodud süsteemi simuleerimiseks keskenduvad teadlased Simsi mängust inspireeritud interaktiivse agentide ühiskonna loomisele. Ülaltoodud arhitektuur on ühendatud ChatGPT-ga ja näitab edukalt 25 agendi interaktsiooni nende liivakastis. Näide agendi tegevusest kogu päeva jooksul on näidatud alloleval pildil.

 

Generatiivagendi uurimistööd, mida peaksite lugema
Generatiivse agendi tegevus ja suhtlus kogu päeva jooksul (Park et al., 2023)
 

Kogu generatiivsete agentide loomiseks ja liivakastis simuleerimiseks mõeldud kood on teadlaste poolt juba avatud lähtekoodiga, mille leiate järgmisest Hoidla. Suund on piisavalt lihtne, et saaksite neid ilma suuremate probleemideta järgida.

Kuna generatiivsetest agentidest on saamas põnev valdkond, tehakse selle põhjal palju uuringuid. Selles artiklis uurime erinevaid generatiivsete agentide dokumente, mida peaksite lugema. Mis need on? Lähme sellesse.

1. Tarkvaraarenduse kommunikatsiooniagendid

. Paber Tarkvaraarenduse kommunikatsiooniagendid (Kvan et al., 2023) on uus lähenemisviis tarkvaraarenduse revolutsiooniliseks muutmiseks generatiivsete agentide abil. Teadlaste välja pakutud eeldus on see, kuidas kogu tarkvaraarendusprotsessi saaks sujuvamaks muuta ja ühtlustada, kasutades suurte keelemudelite (LLM) loomulikku keelt. Tööülesanneteks on koodi väljatöötamine, dokumentide genereerimine, nõuete analüüs ja palju muud.

Uurijad märgivad, et LLM-i abil kogu tarkvara genereerimisel on kaks peamist väljakutset: hallutsinatsioonid ja otsuste tegemisel ristküsitluse puudumine. Nende probleemide lahendamiseks pakuvad teadlased välja vestluspõhise tarkvaraarenduse raamistiku nimega ChatDev.

ChatDevi raamistik järgib nelja faasi: kujundamine, kodeerimine, testimine ja dokumenteerimine. Igas faasis loob ChatDev mitu erineva rolliga agenti, näiteks koodiülevaatajad, tarkvara programmeerijad jne. Et tagada agentidevahelise suhtluse sujumine, töötasid teadlased välja vestlusahela, mis jagas faasid järjestikusteks aatomülesanneteks. Iga alamülesanne rakendaks agentide vahelist koostööd ja suhtlust.

ChatDevi raamistik on näidatud alloleval pildil.

 

Generatiivagendi uurimistööd, mida peaksite lugema
Kavandatud ChatDevi raamistik (Quan et al., 2023)
 

Teadlased viivad läbi erinevaid katseid, et mõõta ChatDevi raamistiku toimimist tarkvaraarenduses. Kasutades gpt3.5-turbo-16k, allpool on tarkvarastatistika katse jõudlus.

 

Generatiivagendi uurimistööd, mida peaksite lugema
ChatDevi raamistiku tarkvara statistika (Quan et al., 2023)
 

Ülaltoodud arv on ChatDevi loodud tarkvarasüsteemide statistilise analüüsi mõõdik. Näiteks genereeritakse vähemalt 39 koodirida, millest maksimum on 359 koodi. Teadlased näitasid ka, et 86.66% loodud tarkvarasüsteemidest töötas korralikult.

See on suurepärane paber, mis näitab potentsiaali muuta arendajate tööd. Lugege artiklit edasi, et mõista ChatDevi täielikku rakendamist. Täielik kood on saadaval ka ChatDevis Hoidla.

2. AgentVerse: mitme agendi koostöö hõlbustamine ja agentide esilekerkiva käitumise uurimine

AgentVerse on artiklis välja pakutud raamistik Chen et al., 2023 agentide rühmade simuleerimiseks suure keelemudeli abil dünaamiliste probleemide lahendamise protseduurideni rühma sees ja rühmaliikmete kohandamiseks vastavalt progresseerumisele. See uuring on loodud selleks, et lahendada staatilise rühmadünaamika väljakutse, kus autonoomne agent ei saa probleemide lahendamisel kohaneda ega areneda.

AgentVerse'i raamistik proovib jagada raamistiku neljaks etapiks, sealhulgas: 

  1. Asjatundjate värbamine: Kohanemisfaas agentide jaoks, et kohaneda probleemi ja lahendusega
  2. Koostööl põhinev otsuste tegemine: agendid arutavad, et sõnastada lahendus ja strateegia probleemi lahendamiseks. 
  3. Toimingu täitmine: agendid viivad keskkonnas toimingu läbi otsuse alusel.
  4. Hindamine: Hinnatakse hetkeseisu ja eesmärke. Tagasiside preemia naaseb esimesse etappi, kui eesmärk on veel täitmist vaja.

AgentVerse'i üldine struktuur on näidatud alloleval pildil.

 

Generatiivagendi uurimistööd, mida peaksite lugema
AgentVerse Framework (Chen et al., 2023)
 

Teadlased katsetasid raamistikku ja võrdlesid AgentVerse'i raamistikku individuaalse agendi lahendusega. Tulemus on näidatud alloleval pildil.

 

Generatiivagendi uurimistööd, mida peaksite lugema
AgentVerse'i jõudluse analüüs (Chen et al., 2023)
 

AgentVerse'i raamistik võib üldiselt ületada üksikuid agente kõigis esitatud ülesannetes. See tõestab, et generatiivsed agendid võiksid paremini toimida kui üksikud agendid, kes üritavad probleeme lahendada. Nende kaudu saate raamistikku proovida Hoidla.

3. AgentSims: avatud lähtekoodiga liivakast suurte keelemudelite hindamiseks

LLM-ide võimekuse hindamine on kogukonnas ja valdkondades endiselt lahtine küsimus. Kolm punkti, mis piiravad LLM-i õiget hindamist, on ülesannete piiratud hindamisvõime, haavatavad võrdlusalused ja ebaobjektiivsed mõõdikud. Nende probleemide lahendamiseks Lin et al., 2023 pakkusid oma artiklis LLM-i etalonina ülesandepõhist hindamist. See lähenemisviis lootis saada LLM-i tööde hindamisel standardseks, kuna see võib leevendada kõiki tõstatatud probleeme. Selle saavutamiseks tutvustavad teadlased raamistikku nimega AgentSims.

AgentSims on interaktiivse ja visualiseerimisinfrastruktuuriga programm LLM-ide hindamisülesannete kureerimiseks. AgentSimsi üldine eesmärk on pakkuda teadlastele ja ekspertidele platvormi ülesannete kavandamise protsessi sujuvamaks muutmiseks ja nende kasutamiseks hindamisvahendina. AgentSimsi esiosa on näidatud alloleval pildil.

 

Generatiivagendi uurimistööd, mida peaksite lugema
AgentSimsi kasutajaliides (Lin et al., 2023)
 

Kuna AgentSimsi sihtmärgiks on kõik, kes vajavad LLM-i hindamist lihtsamal viisil, töötasid teadlased välja esiotsa, kus saame kasutajaliidesega suhelda. Saate proovida ka nende täielikku demo veebisait või pääsete juurde kogu koodile AgentSimsis Hoidla.

Generatiivsed agendid on LLM-ide hiljutine lähenemisviis inimeste käitumise simuleerimiseks. Parki uusim uurimus et al., 2023 on näidanud suurt võimalust, mida generatiivsed agendid saaksid teha. Seetõttu on mitut tüüpi generatiivsetel agentidel põhinevad uuringud ilmunud ja avanud palju uusi uksi.

Selles artiklis oleme rääkinud kolmest erinevast generatiivsete agentide uuringust, sealhulgas:

  1. Tarkvaraarenduse suhtlusagendid (Quan et al., 2023)
  2. AgentVerse: mitme agendi koostöö hõlbustamine ja agentide esilekerkiva käitumise uurimine (Chen et al., 2023)

3. AgentSims: avatud lähtekoodiga liivakast suurte keelemudelite hindamiseks (Lin et al., 2023)
 
 
Cornelius Yudha Wijaya on andmeteaduse juhi assistent ja andmete kirjutaja. Allianz Indonesias täiskohaga töötades armastab ta sotsiaalmeedia ja kirjutamismeedia kaudu Pythoni ja Data näpunäiteid jagada.
 

Ajatempel:

Veel alates KDnuggets