Generative Agent Research Papers You Should Read - KDnuggets

Heruitgegeven door Plato

volgers: 0

Onderzoekspapers over generatieve agenten die u moet lezen
Afbeelding door pikisuperster on Freepik

Generative Agents is een term die door Stanford University en Google-onderzoekers in hun paper is bedacht Generatieve agenten: interactieve simulatie van menselijk gedrag (Park c.s.., 2023). In dit artikel wordt in het onderzoek uitgelegd dat Generative Agents computationele software zijn die op geloofwaardige wijze menselijk gedrag simuleert.

In het artikel introduceren ze hoe agenten kunnen handelen zoals mensen zouden doen: schrijven, koken, spreken, stemmen, slapen, enz., door een generatief model te implementeren, vooral het Large Language Model (LLM). De agenten kunnen aantonen dat ze in staat zijn conclusies te trekken over zichzelf, andere agenten en hun omgeving door gebruik te maken van het natuurlijke taalmodel.

De onderzoeker construeert een systeemarchitectuur om relevante herinneringen op te slaan, te synthetiseren en toe te passen om geloofwaardig gedrag te genereren met behulp van een groot taalmodel, waardoor generatieve agenten mogelijk worden. Dit systeem bestaat uit drie componenten, namelijk:

Geheugenstroom. Het systeem registreert de ervaringen van de agent en is een referentie voor de toekomstige acties van de agent.
Afspiegeling. Het systeem synthetiseert de ervaring in herinneringen, zodat een agent kan leren en beter kan presteren.
Planning. Het systeem vertaalt de inzichten uit het vorige systeem naar actieplannen op hoog niveau en stelt de agent in staat te reageren op de omgeving.

Deze reflectie- en plansystemen werken synergetisch samen met de geheugenstroom om het toekomstige gedrag van de agent te beïnvloeden.

Om het bovenstaande systeem te simuleren, concentreren de onderzoekers zich op het creëren van een interactieve samenleving van agenten, geïnspireerd door het Sims-spel. De bovenstaande architectuur is verbonden met de ChatGPT en toont met succes 25 agentinteracties binnen hun sandbox. In de onderstaande afbeelding ziet u een voorbeeld van de activiteiten van agenten gedurende de dag.

Onderzoekspapers over generatieve agenten die u moet lezen
Generatieve Agent-activiteit en -interactie gedurende de dag (Park c.s.., 2023)

De hele code om Generative Agents te maken en deze in de sandbox te simuleren is door de onderzoekers al open-source gemaakt, die je hieronder kunt vinden bewaarplaats. De richting is zo eenvoudig dat je ze zonder veel problemen kunt volgen.

Nu Generative Agents een spannend vakgebied aan het worden zijn, wordt er veel onderzoek op basis hiervan gedaan. In dit artikel zullen we verschillende Genative Agents-artikelen verkennen die u zou moeten lezen. Wat zijn deze? Laten we erop ingaan.

1. Communicatieve agenten voor softwareontwikkeling

De Communicatieve agenten voor softwareontwikkelingspapier (Kw et al., 2023) is een nieuwe benadering om een revolutie teweeg te brengen in de softwareontwikkeling met behulp van Generative Agents. Het uitgangspunt dat onderzoekers voorstellen is hoe het hele softwareontwikkelingsproces kan worden gestroomlijnd en verenigd met behulp van natuurlijke taalcommunicatie van Large Language Models (LLM). De taken omvatten het ontwikkelen van code, het genereren van de documenten, het analyseren van de vereisten en nog veel meer.

De onderzoekers wijzen erop dat het genereren van volledige software met behulp van LLM twee grote uitdagingen kent: hallucinatie en gebrek aan kruisverhoor bij de besluitvorming. Om deze problemen aan te pakken, stellen de onderzoekers een op chat gebaseerd softwareontwikkelingsframework voor, genaamd ChatDev.

Het ChatDev-framework volgt vier fasen: ontwerpen, coderen, testen en documenteren. In elke fase zou de ChatDev verschillende agenten met verschillende rollen opzetten, bijvoorbeeld coderecensenten, softwareprogrammeurs, enz. Om ervoor te zorgen dat de communicatie tussen agenten soepel verloopt, ontwikkelden de onderzoekers een chatketen die de fasen verdeelde in opeenvolgende atomaire subtaken. Elke subtaak zou de samenwerking en interactie tussen de agenten implementeren.

Het ChatDev-framework wordt weergegeven in de onderstaande afbeelding.

Onderzoekspapers over generatieve agenten die u moet lezen
Het voorgestelde ChatDev Framework (Quan et al., 2023)

De onderzoekers voeren verschillende experimenten uit om te meten hoe het ChatDev-framework presteert bij softwareontwikkeling. Door het gebruiken van gpt3.5-turbo-16kHieronder ziet u de prestaties van het softwarestatistiekenexperiment.

Onderzoekspapers over generatieve agenten die u moet lezen
De ChatDev Framework-softwarestatistieken (Quan et al., 2023)

Het bovenstaande getal is een maatstaf voor statistische analyse met betrekking tot de softwaresystemen die door de ChatDev zijn gegenereerd. Er worden bijvoorbeeld minimaal 39 regels code gegenereerd, met een maximum van 359 codes. De onderzoekers toonden ook aan dat 86.66% van de gegenereerde softwaresystemen goed werkte.

Het is een geweldig artikel dat de potentie laat zien om de manier waarop ontwikkelaars werken te veranderen. Lees het artikel verder om de volledige implementatie van ChatDev te begrijpen. De volledige code is ook beschikbaar in de ChatDev bewaarplaats.

2. AgentVerse: samenwerking tussen meerdere agenten faciliteren en opkomend gedrag bij agenten onderzoeken

AgentVerse is een raamwerk dat in het artikel wordt voorgesteld door Chen et al., 2023 het simuleren van de agentgroepen via het Large Language Model tot het dynamisch oplossen van problemen binnen de groep en het aanpassen van de groepsleden op basis van de progressie. Deze studie is bedoeld om de uitdaging van de statische groepsdynamiek op te lossen, waarbij de autonome agent zich niet kan aanpassen en evolueren bij het oplossen van problemen.

Het AgentVerse-framework probeert het framework in vier stappen op te splitsen, waaronder:

Werving van experts: de aanpassingsfase voor agenten om zich aan te passen aan het probleem en de oplossing
Gezamenlijke besluitvorming: de agenten bespreken het formuleren van een oplossing en strategie om het probleem op te lossen.
Actie-uitvoering: De agenten voeren actie uit in de omgeving op basis van de beslissing.
Evaluatie: De huidige toestand en doelstellingen worden geëvalueerd. De feedbackbeloning keert terug naar de eerste stap als het doel nog behaald moet worden.

De algemene structuur van AgentVerse wordt weergegeven in de onderstaande afbeelding.

Onderzoekspapers over generatieve agenten die u moet lezen
AgentVerse-framework (Chen et al., 2023)

De onderzoekers experimenteerden met het raamwerk en vergeleken het AgentVerse-raamwerk met de individuele agentoplossing. Het resultaat wordt weergegeven in de onderstaande afbeelding.

Onderzoekspapers over generatieve agenten die u moet lezen
Prestatieanalyse van AgentVerse (Chen et al., 2023)

Het AgentVerse-framework kan over het algemeen beter presteren dan individuele agenten in alle gepresenteerde taken. Dit bewijst dat generatieve agenten beter zouden kunnen presteren dan individuele agenten die problemen proberen op te lossen. Je zou het raamwerk via hun kunnen uitproberen bewaarplaats.

3. AgentSims: een open-source sandbox voor evaluatie van grote taalmodellen

Het evalueren van de vaardigheden van LLM's is nog steeds een open vraag binnen de gemeenschap en de vakgebieden. Drie punten die het vermogen beperken om LLM goed te evalueren zijn beperkte evaluatiemogelijkheden door de taken, kwetsbare benchmarks en niet-objectieve statistieken. Om deze problemen aan te pakken, Lin et al., 2023 stelden in hun paper een taakgebaseerde evaluatie voor als LLM-benchmark. Deze aanpak hoopte standaard te worden bij het evalueren van de werken van de LLM, omdat het alle gerezen problemen zou kunnen verlichten. Om dit te bereiken introduceren de onderzoekers een raamwerk genaamd AgentSims.

AgentSims is een programma met interactieve en visualisatie-infrastructuur voor het samenstellen van evaluatietaken voor LLM's. Het algemene doel van AgentSims is om onderzoekers en experts een platform te bieden om het taakontwerpproces te stroomlijnen en deze als evaluatietool te gebruiken. De voorkant van de AgentSims wordt weergegeven in de onderstaande afbeelding.

Onderzoekspapers over generatieve agenten die u moet lezen
AgentSims front-end (Lin et al., 2023)

Omdat het doel van AgentSims iedereen is die LLM-evaluatie op eenvoudigere manieren nodig heeft, hebben de onderzoekers de front-end ontwikkeld waar we met de gebruikersinterface kunnen communiceren. Je kunt ook de volledige demo op hun proberen van de of krijg toegang tot de volledige code in AgentSims bewaarplaats.

Generatieve agenten zijn een recente benadering in de LLM's om menselijk gedrag te simuleren. Het nieuwste onderzoek van Park c.s.., 2023 heeft een grote mogelijkheid laten zien van wat de Generatieve Agenten zouden kunnen doen. Dat is de reden waarom er veel soorten onderzoek op basis van Generative Agents zijn opgedoken en veel nieuwe deuren hebben geopend.

In dit artikel hebben we gesproken over drie verschillende onderzoeken naar Generatieve Agenten, waaronder:

Communicatieve agenten voor softwareontwikkeling papier (Quan et al., 2023)
AgentVerse: samenwerking tussen meerdere agenten faciliteren en opkomend gedrag bij agenten onderzoeken (Chen et al., 2023)

3. AgentSims: een open-source sandbox voor evaluatie van grote taalmodellen (Lin et al., 2023)

Cornellius Yudha Wijaya is een data science assistent-manager en dataschrijver. Terwijl hij fulltime bij Allianz Indonesia werkt, deelt hij graag Python- en Data-tips via sociale media en schrijvende media.