Generative Agent Research Papers You Should Read - KDnuggets

Перевидано Платоном

читають: 0

Дослідження генеративних агентів, які ви повинні прочитати
Зображення на pikisuperstar on Freepik

Генеративні агенти – це термін, введений дослідниками Стенфордського університету та Google у їхній статті під назвою Генеративні агенти: інтерактивні симулякри людської поведінки (Парк та ін., 2023). У цій статті дослідження пояснює, що Generative Agents — це обчислювальне програмне забезпечення, яке правдоподібно імітує поведінку людини.

У статті вони розповідають, як агенти можуть діяти так само, як люди: писати, готувати, говорити, голосувати, спати тощо, реалізуючи генеративну модель, особливо модель великої мови (LLM). Агенти можуть продемонструвати здатність робити висновки про себе, інших агентів і своє оточення, використовуючи модель природної мови.

Дослідник будує архітектуру системи для зберігання, синтезу та застосування відповідних спогадів для створення правдоподібної поведінки за допомогою великої мовної моделі, уможливлюючи генеративні агенти. Ця система складається з трьох компонентів, а саме:

Потік пам'яті. Система записує досвід агента і є орієнтиром для майбутніх дій агента.
Відображення. Система синтезує досвід у спогади, щоб агент міг навчатися та працювати краще.
Планування. Система перетворює інформацію з попередньої системи в плани дій високого рівня та дозволяє агенту реагувати на оточення.

Ці системи відображень і планів працюють синергетично з потоком пам’яті, впливаючи на майбутню поведінку агента.

Щоб змоделювати описану вище систему, дослідники зосередилися на створенні інтерактивного товариства агентів, натхненного грою Sims. Наведена вище архітектура пов’язана з ChatGPT і успішно показує 25 взаємодій агентів у їх пісочниці. Приклад активності агента протягом дня показано на зображенні нижче.

Дослідження генеративних агентів, які ви повинні прочитати
Активність і взаємодія Генератора протягом дня (Парк та ін., 2023)

Увесь код для створення генераторних агентів і їх симуляції в пісочниці дослідники вже зробили відкритим кодом, який ви можете знайти в наступному Сховище. Напрямок досить простий, тому ви можете дотримуватися його без особливих проблем.

Оскільки генеративні агенти стають захоплюючою сферою, багато досліджень відбувається на основі цього. У цій статті ми розглянемо різні документи про генеративні агенти, які вам слід прочитати. Що це за? Давайте вникнемо в це.

1. Комунікативні агенти для розробки програмного забезпечення

Команда Комунікативні агенти для розробки програмного забезпечення (Quan та інші, 2023) — це новий підхід до революції в розробці програмного забезпечення за допомогою генераторних агентів. Передумова, яку пропонують дослідники, полягає в тому, як можна оптимізувати й уніфікувати весь процес розробки програмного забезпечення за допомогою природного мовного спілкування з великих мовних моделей (LLM). Завдання включають розробку коду, створення документів, аналіз вимог і багато іншого.

Дослідники зазначають, що створення цілого програмного забезпечення за допомогою LLM має дві основні проблеми: галюцинації та відсутність перехресного допиту під час прийняття рішень. Щоб вирішити ці проблеми, дослідники пропонують структуру розробки програмного забезпечення на основі чату під назвою ChatDev.

Фреймворк ChatDev складається з чотирьох етапів: проектування, кодування, тестування та документування. На кожному етапі ChatDev встановлює кілька агентів з різними ролями, наприклад, рецензентів коду, програмістів програмного забезпечення тощо. Щоб забезпечити безперебійне спілкування між агентами, дослідники розробили ланцюжок чату, який розділив фази на послідовні атомарні підзавдання. Кожне підзавдання реалізовуватиме співпрацю та взаємодію між агентами.

Фреймворк ChatDev показаний на зображенні нижче.

Дослідження генеративних агентів, які ви повинні прочитати
Запропонована платформа ChatDev (Quan та інші, 2023)

Дослідники проводять різноманітні експерименти, щоб визначити ефективність фреймворку ChatDev у розробці програмного забезпечення. З допомогою gpt3.5-turbo-16k, нижче наведено продуктивність експерименту зі статистикою програмного забезпечення.

Дослідження генеративних агентів, які ви повинні прочитати
Статистика програмного забезпечення ChatDev Framework (Quan та інші, 2023)

Наведене вище число є показником статистичного аналізу програмного забезпечення, згенерованого ChatDev. Наприклад, генерується мінімум 39 рядків коду, а максимум – 359 кодів. Дослідники також показали, що 86.66% створених програмних систем працювали належним чином.

Це чудовий документ, який показує потенціал змінити те, як працюють розробники. Прочитайте статтю далі, щоб зрозуміти повну реалізацію ChatDev. Повний код також доступний у ChatDev Сховище.

2. AgentVerse: сприяння співпраці кількох агентів і вивчення особливостей поведінки агентів

AgentVerse — це структура, запропонована в статті Чен та ін., 2023 для моделювання груп агентів за допомогою великої мовної моделі для динамічних процедур вирішення проблем у групі та налаштування членів групи на основі прогресії. Це дослідження існує для вирішення проблеми статичної групової динаміки, коли автономний агент не може адаптуватися та розвиватися у вирішенні проблем.

Фреймворк AgentVerse намагається розділити фреймворк на чотири етапи, зокрема:

Наймання експертів: фаза коригування для агентів, щоб узгодити проблему та рішення
Спільне прийняття рішень: агенти обговорюють, щоб сформулювати рішення та стратегію вирішення проблеми.
Виконання дії: агенти виконують дії в середовищі на основі рішення.
Оцінка: Оцінюється поточний стан і цілі. Винагорода за зворотний зв’язок повернеться до першого кроку, якщо ціль ще не досягнута.

Загальна структура AgentVerse показана на зображенні нижче.

Дослідження генеративних агентів, які ви повинні прочитати
Фреймворк AgentVerse (Чен та інші, 2023)

Дослідники експериментували з фреймворком і порівнювали фреймворк AgentVerse з окремим агентським рішенням. Результат представлено на зображенні нижче.

Дослідження генеративних агентів, які ви повинні прочитати
Аналіз продуктивності AgentVerse (Чен та інші, 2023)

Фреймворк AgentVerse загалом може перевершити окремих агентів у всіх представлених завданнях. Це доводить, що генеративні агенти можуть працювати краще, ніж окремі агенти, які намагаються вирішити проблеми. Ви можете спробувати фреймворк через їх Сховище.

3. AgentSims: пісочниця з відкритим вихідним кодом для оцінки великої мовної моделі

Оцінка здібностей LLM все ще залишається відкритим питанням у спільноті та галузях. Три моменти, які обмежують здатність правильно оцінювати LLM, це обмежені можливості оцінювання завданнями, вразливі тести та необ’єктивні показники. Щоб вирішити ці проблеми, Lin та інші, 2023 запропонували оцінювання на основі завдань як еталон LLM у своїй роботі. Цей підхід мав намір стати стандартним для оцінювання робіт LLM, оскільки він міг би пом’якшити всі проблеми, які виникають. Щоб досягти цього, дослідники представили структуру під назвою AgentSims.

AgentSims — це програма з інтерактивною інфраструктурою та інфраструктурою візуалізації для кураторства оцінювальних завдань для LLM. Загальна мета AgentSims — надати дослідникам і експертам платформу для оптимізації процесу розробки завдань і використовувати їх як інструмент оцінки. Передня частина AgentSims представлена на зображенні нижче.

Дослідження генеративних агентів, які ви повинні прочитати
Інтерфейс AgentSims (Lin та інші, 2023)

Оскільки ціль AgentSims — це всі, хто потребує оцінювання LLM у простіший спосіб, дослідники розробили інтерфейс, де ми можемо взаємодіяти з інтерфейсом користувача. Ви також можете спробувати повну демо-версію на них сайт або отримати доступ до повного коду в AgentSims Сховище.

Генеративні агенти є нещодавнім підходом у LLM для моделювання людської поведінки. Останні дослідження Park та ін., 2023 рік показав великі можливості того, що можуть зробити Генеративні агенти. Ось чому багато типів досліджень, заснованих на генеративних агентах, виявили та відкрили багато нових дверей.

У цій статті ми говорили про дослідження трьох різних генеративних агентів, зокрема:

Комунікативні агенти для розробки програмного забезпечення (Quan та інші, 2023)
AgentVerse: сприяння співпраці кількох агентів і вивчення особливостей поведінки агентів (Чен та ін., 2023)

3. AgentSims: пісочниця з відкритим вихідним кодом для оцінки великої мовної моделі (Lin та інші, 2023)

Корнеліус Юдха Віджая є помічником менеджера з питань науки про дані та автора даних. Працюючи повний робочий день в Allianz Indonesia, він любить ділитися порадами щодо Python і даних у соціальних мережах і друкованих ЗМІ.