Generatiivisten agenttien tutkimuspaperit, jotka sinun tulee lukea - KDnuggets

Generatiivisten agenttien tutkimuspaperit, jotka sinun tulee lukea – KDnuggets

Lähdesolmu: 2903173

Generatiivisten agenttien tutkimuspaperit, jotka sinun tulee lukea
Kuva pikisuperstar on Freepik
 

Generative Agents on termi, jonka Stanfordin yliopisto ja Googlen tutkijat keksivät julkaisussaan Generatiiviset agentit: Ihmisen käyttäytymisen interaktiiviset simulaatiot (Pysäköidä et ai., 2023). Tässä artikkelissa tutkimus selittää, että generatiiviset agentit ovat laskennallisia ohjelmistoja, jotka simuloivat uskottavalla tavalla ihmisen käyttäytymistä. 

Paperissa he esittelevät, kuinka agentit voisivat toimia kuten ihmiset: kirjoittavat, ruoanlaitto, puhuminen, äänestäminen, nukkuminen jne., ottamalla käyttöön generatiivisen mallin, erityisesti Large Language Model (LLM). Agentit voivat osoittaa kykynsä tehdä johtopäätöksiä itsestään, muista toimijoista ja ympäristöstään hyödyntämällä luonnollisen kielen mallia.

Tutkija rakentaa järjestelmäarkkitehtuurin tallentaakseen, syntetisoidakseen ja soveltaakseen asiaankuuluvia muistoja uskottavan käyttäytymisen luomiseksi käyttämällä suurta kielimallia, mikä mahdollistaa generatiiviset agentit. Tämä järjestelmä koostuu kolmesta osasta, jotka ovat:

  1. Muistivirta. Järjestelmä tallentaa agentin kokemukset ja toimii referenssinä agentin tuleville toimille.
  2. Heijastus. Järjestelmä syntetisoi kokemuksen muistoiksi, jotta agentti voi oppia ja toimia paremmin.
  3. Suunnittelu. Järjestelmä muuntaa edellisen järjestelmän näkemyksen korkean tason toimintasuunnitelmiksi ja antaa agentin reagoida ympäristöön. 

Nämä heijastukset ja suunnitelmajärjestelmät toimivat synergistisesti muistivirran kanssa vaikuttaen agentin tulevaan käyttäytymiseen. 

Simuloidakseen yllä olevaa järjestelmää tutkijat keskittyvät luomaan vuorovaikutteisen agenttien yhteiskunnan, joka on saanut inspiraationsa Sims-pelistä. Yllä oleva arkkitehtuuri on yhdistetty ChatGPT:hen ja näyttää onnistuneesti 25 agentin vuorovaikutusta niiden hiekkalaatikossa. Esimerkki agentin toiminnasta päivän aikana näkyy alla olevassa kuvassa.

 

Generatiivisten agenttien tutkimuspaperit, jotka sinun tulee lukea
Generatiivisen agentin toiminta ja vuorovaikutus koko päivän ajan (Park et ai., 2023)
 

Koko koodi generatiivisten agenttien luomiseksi ja niiden simuloimiseksi hiekkalaatikossa on jo tutkijoiden toimesta tehnyt avoimen lähdekoodin, jonka löydät seuraavasta säilytyspaikka. Suunta on riittävän yksinkertainen, jotta voit seurata niitä ilman suurempia ongelmia.

Generatiivisista toimijoista on tulossa jännittävä ala, ja tämän perusteella tehdään paljon tutkimusta. Tässä artikkelissa tutkimme erilaisia ​​​​Generative Agents -papereita, jotka sinun tulee lukea. Mitä nämä ovat? Mennään asiaan.

1. Ohjelmistokehitysagentit

- Kommunikatiiviset agentit ohjelmistokehitykseen -paperi (Quan et ai., 2023) on uusi lähestymistapa ohjelmistokehityksen mullistamiseen generatiivisten agenttien avulla. Tutkijoiden ehdottama lähtökohta on se, kuinka koko ohjelmistokehitysprosessia voitaisiin virtaviivaistaa ja yhtenäistää Large Language Modelsin (LLM) luonnollisella kielellä. Tehtäviin kuuluu koodin kehittäminen, asiakirjojen generointi, vaatimusten analysointi ja paljon muuta.

Tutkijat huomauttavat, että kokonaisen ohjelmiston luomisessa LLM:n avulla on kaksi suurta haastetta: hallusinaatiot ja ristiintutkinnan puute päätöksenteossa. Näiden ongelmien ratkaisemiseksi tutkijat ehdottavat chat-pohjaista ohjelmistokehityskehystä nimeltä ChatDev.

ChatDev-kehys seuraa neljää vaihetta: suunnittelu, koodaus, testaus ja dokumentointi. Kussakin vaiheessa ChatDev perustaisi useita agentteja erilaisiin rooleihin, esimerkiksi koodintarkistajia, ohjelmistoohjelmoijia jne. Jotta agenttien välinen kommunikaatio sujuisi sujuvasti, tutkijat kehittivät chat-ketjun, joka jakoi vaiheet peräkkäisiksi atomialatehtäviksi. Jokainen osatehtävä toteuttaisi agenttien välistä yhteistyötä ja vuorovaikutusta.

ChatDev-kehys näkyy alla olevassa kuvassa.

 

Generatiivisten agenttien tutkimuspaperit, jotka sinun tulee lukea
Ehdotettu ChatDev-kehys (Quan et ai., 2023)
 

Tutkijat tekevät erilaisia ​​kokeita mitatakseen, kuinka ChatDev-kehys toimii ohjelmistokehityksessä. Käyttämällä gpt3.5-turbo-16k, alla on ohjelmiston tilastojen kokeilun suorituskyky.

 

Generatiivisten agenttien tutkimuspaperit, jotka sinun tulee lukea
ChatDev Framework -ohjelmiston tilastot (Quan et ai., 2023)
 

Yllä oleva luku on ChatDevin luomien ohjelmistojärjestelmien tilastollisen analyysin mittari. Esimerkiksi koodia luodaan vähintään 39 riviä, joista suurin on 359 koodia. Tutkijat osoittivat myös, että 86.66 % luoduista ohjelmistojärjestelmistä toimi oikein.

Se on loistava paperi, joka osoittaa mahdollisuudet muuttaa kehittäjien työskentelyä. Lue artikkeli lisää ymmärtääksesi ChatDevin täydellisen toteutuksen. Koko koodi on saatavilla myös ChatDevissä säilytyspaikka.

2. AgentVerse: Useiden agenttien yhteistyön helpottaminen ja agenttien ilmenevien käyttäytymismallien tutkiminen

AgentVerse on julkaisussa ehdottama kehys Chen et ai., 2023 agenttiryhmien simulointi Large Language -mallin avulla dynaamisiin ongelmanratkaisumenettelyihin ryhmän sisällä ja ryhmän jäsenten säätöön etenemisen perusteella. Tämä tutkimus on olemassa staattisen ryhmädynamiikan haasteen ratkaisemiseksi, jossa autonominen agentti ei voi mukautua ja kehittyä ongelmien ratkaisemisessa.

AgentVerse-kehys yrittää jakaa kehyksen neljään vaiheeseen, mukaan lukien: 

  1. Asiantuntijan rekrytointi: Sopeutumisvaihe, jossa edustajat mukautuvat ongelmaan ja ratkaisuun
  2. Yhteistyöllinen päätöksenteko: Agentit keskustelevat muodostaakseen ratkaisun ja strategian ongelman ratkaisemiseksi. 
  3. Toiminnon suorittaminen: Agentit suorittavat toiminnon ympäristössä päätöksen perusteella.
  4. Arviointi: Nykytilanne ja tavoitteet arvioidaan. Palautepalkkio palaa ensimmäiseen vaiheeseen, jos tavoite on vielä saavutettava.

AgentVersen yleinen rakenne näkyy alla olevassa kuvassa.

 

Generatiivisten agenttien tutkimuspaperit, jotka sinun tulee lukea
AgentVerse Framework (Chen et ai., 2023)
 

Tutkijat kokeilivat kehystä ja vertasivat AgentVerse-kehystä yksittäiseen agenttiratkaisuun. Tulos on esitetty alla olevassa kuvassa.

 

Generatiivisten agenttien tutkimuspaperit, jotka sinun tulee lukea
AgentVersen suorituskykyanalyysi (Chen et ai., 2023)
 

AgentVerse-kehys voi yleensä ylittää yksittäiset agentit kaikissa esitetyissä tehtävissä. Tämä osoittaa, että generatiiviset agentit voisivat toimia paremmin kuin yksittäiset agentit, jotka yrittävät ratkaista ongelmia. Voit kokeilla kehystä heidän kauttaan säilytyspaikka.

3. AgentSims: avoimen lähdekoodin hiekkalaatikko suurten kielimallien arviointiin

LLM:n pätevyyden arviointi on edelleen avoin kysymys yhteisössä ja kentillä. Kolme seikkaa, jotka rajoittavat kykyä arvioida LLM:ää oikein, ovat tehtävien rajalliset arviointikyvyt, haavoittuvat vertailuarvot ja epäobjektiiviset mittarit. Näiden ongelmien ratkaisemiseksi Lin et ai., 2023 ehdottivat tehtäväpohjaista arviointia LLM-vertailuarvoksi kirjoituksessaan. Tämän lähestymistavan toivottiin tulevan standardiksi LLM:n töiden arvioinnissa, koska se voisi lievittää kaikkia esiin tuotuja ongelmia. Tämän saavuttamiseksi tutkijat ottavat käyttöön AgentSims-nimisen kehyksen.

AgentSims on ohjelma, jossa on interaktiivinen ja visualisointiinfrastruktuuri, jonka avulla voidaan kuroida arviointitehtäviä LLM:ille. AgentSimsin yleistavoitteena on tarjota tutkijoille ja asiantuntijoille alusta virtaviivaistaa tehtäväsuunnitteluprosessia ja käyttää niitä arviointityökaluna. AgentSimsin etuosa on esitetty alla olevassa kuvassa.

 

Generatiivisten agenttien tutkimuspaperit, jotka sinun tulee lukea
AgentSims-käyttöliittymä (Lin et ai., 2023)
 

Koska AgentSimsin kohteena ovat kaikki, jotka tarvitsevat LLM-arviointia helpommin, tutkijat kehittivät käyttöliittymän, jossa voimme olla vuorovaikutuksessa käyttöliittymän kanssa. Voit myös kokeilla heidän koko demoa verkkosivusto tai käytä koko koodia AgentSimsissä säilytyspaikka.

Generatiiviset agentit ovat uusi lähestymistapa LLM:issä ihmisten käyttäytymisen simuloimiseksi. Parkin uusin tutkimus et ai., 2023 on osoittanut suuren mahdollisuuden siihen, mitä generatiiviset agentit voisivat tehdä. Tästä syystä monen tyyppinen generatiivisiin toimijoihin perustuva tutkimus on ilmestynyt ja avannut monia uusia ovia.

Tässä artikkelissa olemme puhuneet kolmesta erilaisesta generatiivisten tekijöiden tutkimuksesta, mukaan lukien:

  1. Viestintäagentit ohjelmistokehitykseen -paperi (Quan et ai., 2023)
  2. AgentVerse: Useiden agenttien yhteistyön helpottaminen ja agenttien ilmenevien käyttäytymismallien tutkiminen (Chen et ai., 2023)

3. AgentSims: avoimen lähdekoodin hiekkalaatikko suurten kielimallien arviointiin (Lin et ai., 2023)
 
 
Cornelius Yudha Wijaya on datatieteen apulaisjohtaja ja tietojen kirjoittaja. Työskennellessään kokopäiväisesti Allianz Indonesiassa hän mielellään jakaa Python- ja Data-vinkkejä sosiaalisen median ja kirjoitusmedian kautta.
 

Aikaleima:

Lisää aiheesta KDnuggets