Generative Agent Research Papers You Should Read - KDnuggets

Opublikowane ponownie przez Plato

Obserwuje: 0

Artykuły badawcze dotyczące agentów generatywnych, które powinieneś przeczytać
Image by pikisupergwiazda on Freepik

Agenci generatywni to termin ukuty przez badaczy Uniwersytetu Stanforda i Google w artykule zatytułowanym Agenci generatywni: interaktywne symulakry ludzkiego zachowania (Park i wsp., 2023). W artykule tym badanie wyjaśnia, że agenci generatywni to oprogramowanie obliczeniowe, które w wiarygodny sposób symuluje ludzkie zachowanie.

W artykule przedstawiają, w jaki sposób agenci mogliby zachowywać się tak, jak robiliby ludzie: pisanie, gotowanie, mówienie, głosowanie, spanie itp. poprzez wdrożenie modelu generatywnego, zwłaszcza modelu dużego języka (LLM). Agenci mogą wykazać się zdolnością do wyciągania wniosków na temat siebie, innych agentów i swojego otoczenia, wykorzystując model języka naturalnego.

Badacz konstruuje architekturę systemu do przechowywania, syntezy i stosowania odpowiednich pamięci w celu generowania wiarygodnych zachowań przy użyciu dużego modelu językowego, umożliwiając agentom generatywnym. System ten składa się z trzech elementów, są to:

Strumień pamięci. System rejestruje doświadczenia agenta i stanowi punkt odniesienia dla jego przyszłych działań.
Refleksja. System syntetyzuje doświadczenie we wspomnienia, dzięki czemu agent może się uczyć i działać lepiej.
Planowanie. System przekłada wiedzę z poprzedniego systemu na plany działania wysokiego szczebla i pozwala agentowi reagować na otoczenie.

Te refleksje i systemy planów działają synergicznie ze strumieniem pamięci, wpływając na przyszłe zachowanie agenta.

Aby symulować powyższy system, badacze skupiają się na stworzeniu interaktywnego społeczeństwa agentów inspirowanego grą The Sims. Powyższa architektura jest połączona z ChatGPT i pomyślnie pokazuje 25 interakcji agentów w ich piaskownicy. Przykładową aktywność agenta w ciągu dnia przedstawia poniższy obrazek.

Artykuły badawcze dotyczące agentów generatywnych, które powinieneś przeczytać
Aktywność agenta generatywnego i interakcja w ciągu dnia (Park i wsp., 2023)

Cały kod do tworzenia agentów generatywnych i symulowania ich w piaskownicy został już udostępniony przez badaczy jako open source, co można znaleźć w poniższej tabeli składnica. Kierunek jest na tyle prosty, że można je podążać bez większego problemu.

Ponieważ agenci generatywni stają się ekscytującą dziedziną, wiele badań opiera się na tym. W tym artykule omówimy różne artykuły dotyczące agentów generatywnych, które powinieneś przeczytać. Co to jest? Zajmijmy się tym.

1. Agenci komunikatywni przy tworzeniu oprogramowania

Połączenia Artykuł dotyczący agentów komunikacyjnych w tworzeniu oprogramowania (Quan i in., 2023) to nowe podejście do rewolucjonizacji tworzenia oprogramowania przy użyciu agentów generatywnych. Założeniem zaproponowanym przez badaczy jest to, w jaki sposób można usprawnić i ujednolicić cały proces tworzenia oprogramowania przy użyciu komunikacji w języku naturalnym z modeli dużego języka (LLM). Zadania obejmują tworzenie kodu, generowanie dokumentów, analizę wymagań i wiele innych.

Naukowcy zwracają uwagę, że wygenerowanie całego oprogramowania przy użyciu LLM wiąże się z dwoma głównymi wyzwaniami: halucynacjami i brakiem analizy krzyżowej podczas podejmowania decyzji. Aby rozwiązać te problemy, badacze proponują platformę tworzenia oprogramowania opartą na czacie o nazwie ChatDev.

Struktura ChatDev składa się z czterech faz: projektowania, kodowania, testowania i dokumentowania. Na każdym etapie ChatDev ustanawiał kilku agentów pełniących różne role, na przykład recenzentów kodu, programistów oprogramowania itp. Aby zapewnić płynną komunikację między agentami, badacze opracowali łańcuch czatów, który podzielił fazy na kolejne, atomowe podzadania. Każde podzadanie wdrażałoby współpracę i interakcję między agentami.

Framework ChatDev pokazano na obrazku poniżej.

Artykuły badawcze dotyczące agentów generatywnych, które powinieneś przeczytać
Proponowane środowisko ChatDev (Quan i in., 2023)

Naukowcy przeprowadzają różne eksperymenty, aby zmierzyć skuteczność platformy ChatDev w tworzeniu oprogramowania. Używając gpt3.5-turbo-16kponiżej znajduje się wydajność eksperymentu ze statystykami oprogramowania.

Artykuły badawcze dotyczące agentów generatywnych, które powinieneś przeczytać
Statystyki oprogramowania ChatDev Framework (Quan i in., 2023)

Powyższa liczba stanowi miarę analizy statystycznej dotyczącej systemów oprogramowania generowanych przez ChatDev. Na przykład generowanych jest co najmniej 39 linii kodu, a maksymalnie 359 kodów. Naukowcy wykazali również, że 86.66% wygenerowanych systemów oprogramowania działało poprawnie.

To świetny artykuł, który pokazuje potencjał zmiany sposobu pracy programistów. Przeczytaj dalej artykuł, aby zrozumieć pełną implementację ChatDev. Pełny kod jest również dostępny w ChatDev składnica.

2. AgentVerse: ułatwianie współpracy wielu agentów i badanie pojawiających się zachowań agentów

AgentVerse to framework zaproponowany w artykule autorstwa Chena i in, 2023 symulować grupy agentów za pomocą modelu dużego języka w celu dynamicznych procedur rozwiązywania problemów w grupie i dostosowywania członków grupy w oparciu o postęp. Badanie to ma na celu rozwiązanie problemu statycznej dynamiki grupowej, w której autonomiczny agent nie może się przystosować i ewoluować w rozwiązywaniu problemów.

Struktura AgentVerse próbuje podzielić strukturę na cztery etapy, w tym:

Rekrutacja ekspertów: faza dostosowania agentów do problemu i rozwiązania
Wspólne podejmowanie decyzji: agenci dyskutują nad sformułowaniem rozwiązania i strategii rozwiązania problemu.
Wykonanie akcji: Agenci wykonują akcję w środowisku na podstawie decyzji.
Ocena: Oceniany jest obecny stan i cele. Nagroda za informację zwrotną powróci do pierwszego kroku, jeśli cel nadal wymaga osiągnięcia.

Ogólną strukturę AgentVerse pokazano na poniższym obrazku.

Artykuły badawcze dotyczące agentów generatywnych, które powinieneś przeczytać
Struktura AgentVerse (Chen i in., 2023)

Badacze eksperymentowali ze strukturą i porównali platformę AgentVerse z rozwiązaniem dla poszczególnych agentów. Wynik przedstawiono na obrazku poniżej.

Artykuły badawcze dotyczące agentów generatywnych, które powinieneś przeczytać
Analiza wydajności AgentVerse (Chen i in., 2023)

Struktura AgentVerse może ogólnie przewyższać poszczególnych agentów we wszystkich przedstawionych zadaniach. Dowodzi to, że agenci generatywni mogą działać lepiej niż indywidualni agenci próbujący rozwiązać problemy. Możesz wypróbować framework poprzez ich składnica.

3. AgentSims: piaskownica typu open source do oceny modelu dużego języka

Ocena zdolności LLM jest nadal kwestią otwartą w społeczności i dziedzinach. Trzy punkty ograniczające zdolność właściwej oceny LLM to ograniczone możliwości oceny przez zadania, wrażliwe punkty odniesienia i nieobiektywne wskaźniki. Aby uporać się z tymi problemami, Lin i in., 2023 w swoim artykule zaproponowali ocenę opartą na zadaniach jako punkt odniesienia dla LLM. Podejście to miało stać się standardem w ocenie prac LLM, ponieważ mogłoby złagodzić wszystkie zgłaszane problemy. Aby to osiągnąć, badacze wprowadzają platformę o nazwie AgentSims.

AgentSims to program z infrastrukturą interaktywną i wizualizacyjną do zarządzania zadaniami ewaluacyjnymi dla LLM. Ogólnym celem AgentSims jest zapewnienie badaczom i ekspertom platformy umożliwiającej usprawnienie procesu projektowania zadań i wykorzystanie jej jako narzędzia oceny. Przód AgentSims przedstawiono na obrazku poniżej.

Artykuły badawcze dotyczące agentów generatywnych, które powinieneś przeczytać
Interfejs AgentSims (Lin i in., 2023)

Ponieważ celem AgentSims są wszyscy, którzy wymagają łatwiejszej oceny LLM, badacze opracowali interfejs, w którym możemy wchodzić w interakcję z interfejsem użytkownika. Możesz także wypróbować pełne demo na ich stronie lub uzyskaj dostęp do pełnego kodu w AgentSims składnica.

Agenci generatywni to najnowsze podejście w LLM do symulacji ludzkich zachowań. Najnowsze badania Parka i wsp., rok 2023 pokazał ogromne możliwości tego, co mogą zrobić Agenci generatywni. Dlatego pojawiło się wiele rodzajów badań opartych na agentach generatywnych, które otworzyły wiele nowych drzwi.

W tym artykule omówiliśmy trzy różne badania dotyczące agentów generatywnych, w tym:

Dokument dotyczący agentów komunikacyjnych w zakresie tworzenia oprogramowania (Quan i in., 2023)
AgentVerse: Ułatwianie współpracy wielu agentów i badanie pojawiających się zachowań agentów (Chena i in, 2023)

3. AgentSims: piaskownica typu open source do oceny modelu dużego języka (Lin i in., 2023)

Cornelius Yudha Wijaya jest kierownikiem i asystentem analityka danych oraz autorem danych. Pracując na pełny etat w Allianz Indonesia, uwielbia dzielić się wskazówkami dotyczącymi Pythona i danych za pośrednictwem mediów społecznościowych i mediów.