Статьи по исследованию генеративных агентов, которые вам следует прочитать

Статьи по исследованию генеративных агентов, которые вам следует прочитать – KDnuggets

Исходный узел: 2903173

Статьи по исследованию генеративных агентов, которые вам следует прочитать
Изображение на пикисуперзвезда on Freepik
 

Генеративные агенты — это термин, придуманный исследователями Стэнфордского университета и Google в их статье под названием Генеративные агенты: интерактивные симулякры человеческого поведения (Парк и др.., 2023). В этой статье исследование объясняет, что генеративные агенты — это вычислительное программное обеспечение, которое правдоподобно моделирует поведение человека. 

В статье они рассказывают, как агенты могут действовать так же, как люди: писать, готовить, говорить, голосовать, спать и т. д., реализуя генеративную модель, особенно модель большого языка (LLM). Агенты могут продемонстрировать способность делать выводы о себе, других агентах и ​​окружающей среде, используя модель естественного языка.

Исследователь конструирует архитектуру системы для хранения, синтеза и применения соответствующих воспоминаний для создания правдоподобного поведения, используя большую языковую модель, позволяющую создавать генеративные агенты. Эта система состояла из трех компонентов:

  1. Поток памяти. Система записывает опыт агента и служит ориентиром для будущих действий агента.
  2. отражение. Система синтезирует полученный опыт в воспоминания, чтобы агент мог лучше учиться и работать.
  3. Меню. Система преобразует знания предыдущей системы в планы действий высокого уровня и позволяет агенту реагировать на окружающую среду. 

Эти размышления и системы планирования работают синергетически с потоком памяти, влияя на будущее поведение агента. 

Чтобы смоделировать описанную выше систему, исследователи сосредоточились на создании интерактивного общества агентов, вдохновленного игрой Sims. Приведенная выше архитектура связана с ChatGPT и успешно отображает 25 взаимодействий агентов в их песочнице. Пример активности агента в течение дня показан на изображении ниже.

 

Статьи по исследованию генеративных агентов, которые вам следует прочитать
Активность и взаимодействие генеративного агента в течение дня (Парк и др.., 2023)
 

Весь код для создания генеративных агентов и их моделирования в «песочнице» уже выложен исследователями в открытый исходный код, который вы можете найти в следующем документе. хранилище. Направления настолько просты, что вы сможете следовать им без особых проблем.

Поскольку генеративные агенты становятся интересной областью, на этой основе проводится много исследований. В этой статье мы рассмотрим различные статьи о генеративных агентах, которые вам следует прочитать. Что это? Давайте займемся этим.

1. Коммуникативные агенты для разработки программного обеспечения.

Ассоциация Статья «Коммуникативные агенты для разработки программного обеспечения» (Цюань и другие, 2023) — это новый подход к революционному развитию программного обеспечения с использованием генеративных агентов. Предпосылка, которую предлагают исследователи, заключается в том, как можно упростить и унифицировать весь процесс разработки программного обеспечения с помощью общения на естественном языке из моделей большого языка (LLM). В задачи входит разработка кода, генерация документов, анализ требований и многое другое.

Исследователи отмечают, что создание всего программного обеспечения с использованием LLM сопряжено с двумя основными проблемами: галлюцинациями и отсутствием перекрестного допроса при принятии решений. Чтобы решить эти проблемы, исследователи предлагают среду разработки программного обеспечения на основе чата под названием ChatDev.

Платформа ChatDev состоит из четырех этапов: проектирование, кодирование, тестирование и документирование. На каждом этапе ChatDev создавал несколько агентов с различными ролями, например, рецензентов кода, программистов и т. д. Чтобы обеспечить бесперебойную связь между агентами, исследователи разработали цепочку чата, которая делила этапы на последовательные атомарные подзадачи. Каждая подзадача будет реализовывать сотрудничество и взаимодействие между агентами.

Платформа ChatDev показана на изображении ниже.

 

Статьи по исследованию генеративных агентов, которые вам следует прочитать
Предлагаемая платформа ChatDev Framework (Quan и другие, 2023)
 

Исследователи проводят различные эксперименты, чтобы оценить эффективность платформы ChatDev при разработке программного обеспечения. Используя gpt3.5-турбо-16к, ниже приведены результаты эксперимента по статистике программного обеспечения.

 

Статьи по исследованию генеративных агентов, которые вам следует прочитать
Статистика программного обеспечения ChatDev Framework (Quan и другие, 2023)
 

Приведенное выше число представляет собой показатель статистического анализа программных систем, созданных ChatDev. Например, генерируется минимум 39 строк кода, а максимум — 359 кодов. Исследователи также показали, что 86.66% созданных программных систем работали правильно.

Это отличная статья, показывающая потенциал изменения методов работы разработчиков. Прочтите статью дальше, чтобы понять полную реализацию ChatDev. Полный код также доступен в ChatDev. хранилище.

2. AgentVerse: содействие совместной работе нескольких агентов и изучение возникающего поведения агентов.

AgentVerse — это фреймворк, предложенный в статье Чен и др.., 2023 моделировать группы агентов с помощью большой языковой модели для динамических процедур решения проблем внутри группы и корректировки членов группы в зависимости от прогресса. Это исследование существует для решения проблемы статической групповой динамики, когда автономный агент не может адаптироваться и развиваться при решении проблем.

Платформа AgentVerse пытается разделить структуру на четыре этапа, в том числе: 

  1. Подбор экспертов: этап адаптации агентов к проблеме и решению.
  2. Совместное принятие решений: агенты обсуждают, как сформулировать решение и стратегию решения проблемы. 
  3. Выполнение действия: агенты выполняют действие в среде на основе решения.
  4. Оценка: оценивается текущее состояние и цели. Награда за обратную связь вернется к первому шагу, если цель все еще необходимо достичь.

Общая структура AgentVerse показана на изображении ниже.

 

Статьи по исследованию генеративных агентов, которые вам следует прочитать
AgentVerse Framework (Чен и другие, 2023)
 

Исследователи экспериментировали с платформой и сравнивали платформу AgentVerse с решением для отдельных агентов. Результат представлен на изображении ниже.

 

Статьи по исследованию генеративных агентов, которые вам следует прочитать
Анализ производительности AgentVerse (Чен и другие, 2023)
 

Фреймворк AgentVerse в целом может превосходить отдельных агентов во всех представленных задачах. Это доказывает, что генеративные агенты могут работать лучше, чем отдельные агенты, пытающиеся решить проблемы. Вы можете опробовать эту структуру через их хранилище.

3. AgentSims: песочница с открытым исходным кодом для оценки больших языковых моделей.

Оценка способностей LLM по-прежнему остается открытым вопросом в сообществе и в областях. Три момента, которые ограничивают способность правильно оценивать LLM, — это ограниченные возможности оценки по задачам, уязвимые тесты и необъективные показатели. Чтобы справиться с этими проблемами, Лин и другие, 2023 в своей статье предложили оценку на основе задач в качестве эталона LLM. Предполагалось, что этот подход станет стандартом при оценке работ LLM, поскольку он сможет смягчить все возникающие проблемы. Для этого исследователи представили платформу под названием AgentSims.

AgentSims — это программа с интерактивной инфраструктурой и инфраструктурой визуализации для выполнения оценочных задач для студентов LLM. Общая цель AgentSims — предоставить исследователям и экспертам платформу для оптимизации процесса разработки задач и использования их в качестве инструмента оценки. Внешний вид AgentSims представлен на изображении ниже.

 

Статьи по исследованию генеративных агентов, которые вам следует прочитать
Интерфейс AgentSims (Лин и другие, 2023)
 

Поскольку целью AgentSims являются все, кому требуется более простая оценка LLM, исследователи разработали интерфейс, с помощью которого мы можем взаимодействовать с пользовательским интерфейсом. Вы также можете попробовать полную демо-версию на их веб-сайт или получите доступ к полному коду в AgentSims хранилище.

Генеративные агенты — это недавний подход в LLM к моделированию человеческого поведения. Последние исследования Парка и др.., 2023 год показал большие возможности того, что могут сделать Генеративные Агенты. Вот почему появилось множество типов исследований, основанных на генеративных агентах, которые открыли много новых дверей.

В этой статье мы говорили о трех различных исследованиях генеративных агентов, в том числе:

  1. Статья «Коммуникативные агенты для разработки программного обеспечения» (Quan и другие, 2023 )
  2. AgentVerse: содействие многоагентному сотрудничеству и изучение возникающего поведения агентов (Чен и др.., 2023)

3. AgentSims: песочница с открытым исходным кодом для оценки больших языковых моделей (Лин и другие, 2023 )
 
 
Корнелиус Юдха Виджая является помощником менеджера по науке о данных и автором данных. Работая полный рабочий день в Allianz Indonesia, он любит делиться советами по Python и данным в социальных сетях и в печатных СМИ.
 

Отметка времени:

Больше от КДнаггетс