Lucrări de cercetare a agenților generativi pe care ar trebui să le citiți - KDnuggets

Lucrări de cercetare a agenților generativi pe care ar trebui să le citiți – KDnuggets

Nodul sursă: 2903173

Lucrări de cercetare a agenților generativi pe care ar trebui să le citiți
Imagini de pikisuperstar on Freepik
 

Generative Agents este un termen inventat de Universitatea Stanford și cercetătorii Google în lucrarea lor numită Agenți generativi: simulacre interactive ale comportamentului uman (Parc et al., 2023). În această lucrare, cercetarea explică faptul că agenții generativi sunt software de calcul care simulează credibil comportamentul uman. 

În lucrare, ei prezintă modul în care agenții ar putea acționa ca ceea ce ar face oamenii: scris, gătit, vorbit, votat, dormit etc., prin implementarea unui model generativ, în special a modelului de limbaj mare (LLM). Agenții pot demonstra capacitatea de a face inferențe despre ei înșiși, despre alți agenți și despre mediul lor prin valorificarea modelului limbajului natural.

Cercetătorul construiește o arhitectură de sistem pentru a stoca, sintetiza și aplica amintiri relevante pentru a genera un comportament credibil folosind un model de limbaj mare, care să permită agenți generativi. Acest sistem este format din trei componente, acestea sunt:

  1. Flux de memorie. Sistemul înregistrează experiențele agentului și este o referință pentru acțiunile viitoare ale agentului.
  2. Reflecţie. Sistemul sintetizează experiența în amintiri pentru ca un agent să învețe și să performeze mai bine.
  3. Planificare. Sistemul traduce informațiile din sistemul anterior în planuri de acțiune la nivel înalt și permite agentului să reacționeze la mediu. 

Aceste reflecții și sisteme de plan funcționează sinergic cu fluxul de memorie pentru a influența comportamentul viitor al agentului. 

Pentru a simula sistemul de mai sus, cercetătorii se concentrează pe crearea unei societăți interactive de agenți inspirate de jocul Sims. Arhitectura de mai sus este conectată cu ChatGPT și arată cu succes 25 de interacțiuni ale agenților în sandbox-ul lor. Un exemplu de activitate a agentului pe parcursul zilei este prezentat în imaginea de mai jos.

 

Lucrări de cercetare a agenților generativi pe care ar trebui să le citiți
Activitatea și interacțiunea Agentului Generativ pe parcursul zilei (Park et al., 2023)
 

Întregul cod pentru a crea agenți generativi și a-i simula în sandbox este deja făcut open-source de către cercetători, pe care îl puteți găsi în următoarele depozit. Direcția este suficient de simplă încât să le poți urma fără prea multe probleme.

Odată cu agenții generativi devenind un domeniu interesant, multe cercetări se desfășoară pe baza acestui lucru. În acest articol, vom explora diverse lucrări despre Agenții generativi pe care ar trebui să le citiți. Ce sunt acestea? Să intrăm în asta.

1. Agenți de comunicare pentru dezvoltarea software

Agenții de comunicare pentru dezvoltarea software-ului (Quan et al., 2023) este o nouă abordare a revoluționării dezvoltării de software folosind agenții generativi. Premisa pe care o propun cercetătorii este modul în care întregul proces de dezvoltare a software-ului ar putea fi eficientizat și unificat folosind comunicarea în limbaj natural din modelele de limbaj mari (LLM). Sarcinile includ dezvoltarea codului, generarea documentelor, analiza cerințelor și multe altele.

Cercetătorii subliniază că generarea unui întreg software folosind LLM are două provocări majore: halucinația și lipsa interogatoriilor în procesul decizional. Pentru a rezolva aceste probleme, cercetătorii propun un cadru de dezvoltare software bazat pe chat numit ChatDev.

CadDev ChatDev urmează patru faze: proiectare, codificare, testare și documentare. În fiecare fază, ChatDev ar stabili mai mulți agenți cu diferite roluri, de exemplu, recenzori de cod, programatori de software etc. Pentru a se asigura că comunicarea dintre agenți se desfășoară fără probleme, cercetătorii au dezvoltat un lanț de chat care a împărțit fazele în subsarcini atomice secvențiale. Fiecare subsarcină ar implementa colaborarea și interacțiunea dintre agenți.

Frame-ul ChatDev este prezentat în imaginea de mai jos.

 

Lucrări de cercetare a agenților generativi pe care ar trebui să le citiți
Cadrul ChatDev propus (Quan et al., 2023)
 

Cercetătorii efectuează diverse experimente pentru a măsura cum funcționează cadrul ChatDev în dezvoltarea de software. Prin utilizarea gpt3.5-turbo-16k, mai jos este performanța experimentului cu statisticile software.

 

Lucrări de cercetare a agenților generativi pe care ar trebui să le citiți
Statisticile software-ului ChatDev Framework (Quan et al., 2023)
 

Numărul de mai sus este o metrică a analizei statistice privind sistemele software generate de ChatDev. De exemplu, sunt generate minim 39 de linii de cod, maximul fiind de 359 de coduri. Cercetătorii au mai arătat că 86.66% din sistemele software generate au funcționat corect.

Este o lucrare grozavă care arată potențialul de a schimba modul în care lucrează dezvoltatorii. Citiți în continuare lucrarea pentru a înțelege implementarea completă a ChatDev. Codul complet este disponibil și în ChatDev depozit.

2. AgentVerse: Facilitarea colaborării cu mai mulți agenți și explorarea comportamentelor emergente în agenți

AgentVerse este un cadru propus în lucrare de Chen şi colab., 2023 pentru a simula grupurile de agenți prin intermediul modelului de limbă mare la proceduri dinamice de rezolvare a problemelor în cadrul grupului și ajustarea membrilor grupului pe baza progresiei. Acest studiu există pentru a rezolva provocarea dinamicii statice de grup în care agentul autonom nu se poate adapta și evolua în rezolvarea problemelor.

Cadrul AgentVerse încearcă să împartă cadrul în patru pași, inclusiv: 

  1. Recrutarea experților: faza de ajustare a agenților pentru a se alinia cu problema și soluția
  2. Luarea deciziilor în colaborare: agenții discută pentru a formula o soluție și o strategie pentru a rezolva problema. 
  3. Executarea acțiunii: agenții execută acțiuni în mediu pe baza deciziei.
  4. Evaluare: Condiția actuală și obiectivele sunt evaluate. Recompensa de feedback va reveni la primul pas dacă obiectivul trebuie încă îndeplinit.

Structura generală a AgentVerse este prezentată în imaginea de mai jos.

 

Lucrări de cercetare a agenților generativi pe care ar trebui să le citiți
Cadrul AgentVerse (Chen et al., 2023)
 

Cercetătorii au experimentat cu cadrul și au comparat cadrul AgentVerse cu soluția de agent individual. Rezultatul este prezentat în imaginea de mai jos.

 

Lucrări de cercetare a agenților generativi pe care ar trebui să le citiți
Analiza performanței AgentVerse (Chen et al., 2023)
 

Cadrul AgentVerse poate depăși în general agenții individuali în toate sarcinile prezentate. Acest lucru demonstrează că agenții generativi ar putea funcționa mai bine decât agenții individuali care încearcă să rezolve probleme. Ai putea încerca cadrul prin intermediul lor depozit.

3. AgentSims: un Sandbox open-source pentru evaluarea modelelor de limbi mari

Evaluarea capacității LLM-urilor este încă o întrebare deschisă în cadrul comunității și al domeniilor. Trei puncte care limitează capacitatea de a evalua corect LLM sunt abilitățile limitate de evaluare a sarcinilor, reperele vulnerabile și valorile neobiective. Pentru a rezolva aceste probleme, Lin et al., 2023 au propus o evaluare bazată pe sarcini ca punct de referință LLM în lucrarea lor. Această abordare spera să devină standard în evaluarea lucrărilor LLM, deoarece ar putea atenua toate problemele ridicate. Pentru a realiza acest lucru, cercetătorii introduc un cadru numit AgentSims.

AgentSims este un program cu infrastructură interactivă și de vizualizare pentru gestionarea sarcinilor de evaluare pentru LLM. Obiectivul general al AgentSims este de a oferi cercetătorilor și experților o platformă pentru a eficientiza procesul de proiectare a sarcinilor și a le folosi ca instrument de evaluare. Partea frontală a AgentSims este prezentată în imaginea de mai jos.

 

Lucrări de cercetare a agenților generativi pe care ar trebui să le citiți
AgentSims Front End (Lin et al., 2023)
 

Întrucât ținta AgentSims este toți cei care necesită evaluare LLM în moduri mai ușoare, cercetătorii au dezvoltat front-end-ul în care putem interacționa cu interfața de utilizare. Puteți încerca, de asemenea, demo-ul complet pe ei sau accesați codul complet în AgentSims depozit.

Agenții generativi sunt o abordare recentă în LLMs pentru a simula comportamentele umane. Cea mai recentă cercetare a lui Park et al., 2023 a arătat o mare posibilitate a ceea ce ar putea face Agenții Generativi. De aceea, multe tipuri de cercetări bazate pe agenții generativi au apărut și au deschis multe uși noi.

În acest articol, am vorbit despre trei cercetări diferite privind agenții generativi, inclusiv:

  1. Agenți de comunicare pentru dezvoltarea software-ului (Quan et al., 2023)
  2. AgentVerse: Facilitarea colaborării cu mai mulți agenți și explorarea comportamentelor emergente în agenți (Chen şi colab., 2023)

3. AgentSims: un Sandbox open-source pentru evaluarea modelelor de limbi mari (Lin et al., 2023)
 
 
Cornellius Yudha Wijaya este un asistent manager și redactor de date pentru știința datelor. În timp ce lucrează cu normă întreagă la Allianz Indonesia, îi place să împărtășească sfaturi Python și date prin intermediul rețelelor sociale și al rețelelor de scris.
 

Timestamp-ul:

Mai mult de la KDnuggets