Generative Agent Research Papers You Should Read - KDnuggets

Reeditado por Platón

seguidores: 0

Artículos de investigación sobre agentes generativos que debe leer
Imagen de pikisuperestrella on Freepik

Agentes generativos es un término acuñado por la Universidad de Stanford y los investigadores de Google en su artículo llamado Agentes generativos: simulacros interactivos del comportamiento humano (Parque et al., 2023). En este artículo, la investigación explica que los Agentes Generativos son software computacional que simulan de manera creíble el comportamiento humano.

En el artículo, presentan cómo los agentes podrían actuar como lo harían los humanos: escribir, cocinar, hablar, votar, dormir, etc., implementando un modelo generativo, especialmente el Modelo de Lenguaje Grande (LLM). Los agentes pueden mostrar la capacidad de hacer inferencias sobre ellos mismos, otros agentes y su entorno aprovechando el modelo del lenguaje natural.

El investigador construye una arquitectura de sistema para almacenar, sintetizar y aplicar recuerdos relevantes para generar comportamientos creíbles utilizando un modelo de lenguaje grande, habilitando agentes generativos. Este sistema constituido por tres componentes, son:

Flujo de memoria. El sistema registra las experiencias del agente y es una referencia para las acciones futuras del agente.
Reflexión. El sistema sintetiza la experiencia en recuerdos para que un agente aprenda y se desempeñe mejor.
Planificación. El sistema traduce la información del sistema anterior en planes de acción de alto nivel y permite al agente reaccionar ante el entorno.

Estas reflexiones y sistemas de planificación funcionan sinérgicamente con el flujo de memoria para influir en el comportamiento futuro del agente.

Para simular el sistema anterior, los investigadores se centran en crear una sociedad interactiva de agentes inspirada en el juego de Los Sims. La arquitectura anterior está conectada con ChatGPT y muestra con éxito 25 interacciones de agentes dentro de su zona de pruebas. En la siguiente imagen se muestra un ejemplo de la actividad del agente a lo largo del día.

Artículos de investigación sobre agentes generativos que debe leer
Actividad e interacción del Agente Generativo a lo largo del día (Parque et al, 2023)

Los investigadores ya han hecho de código abierto todo el código para crear Agentes Generativos y simularlos en el sandbox, que puede encontrar a continuación. repositorio. La dirección es lo suficientemente simple como para que puedas seguirlas sin muchos problemas.

Dado que los agentes generativos se están convirtiendo en un campo apasionante, se están realizando muchas investigaciones basadas en esto. En este artículo, exploraremos varios artículos sobre agentes generativos que debería leer. ¿Qué son éstos? Entremos en ello.

1. Agentes Comunicativos para el Desarrollo de Software

La Documento sobre agentes comunicativos para el desarrollo de software. (cuánto et al., 2023) es un nuevo enfoque para revolucionar el desarrollo de software utilizando agentes generativos. La premisa que proponen los investigadores es cómo todo el proceso de desarrollo de software podría simplificarse y unificarse utilizando la comunicación en lenguaje natural de Large Language Models (LLM). Las tareas incluyen desarrollar código, generar documentos, analizar los requisitos y muchas más.

Los investigadores señalan que generar un software completo utilizando LLM tiene dos desafíos principales: alucinaciones y falta de contrainterrogatorio en la toma de decisiones. Para abordar estos problemas, los investigadores proponen un marco de desarrollo de software basado en chat llamado ChatDev.

El marco ChatDev sigue cuatro fases: diseño, codificación, prueba y documentación. En cada fase, ChatDev establecería varios agentes con diversas funciones, por ejemplo, revisores de código, programadores de software, etc. Para garantizar que la comunicación entre agentes se desarrolle sin problemas, los investigadores desarrollaron una cadena de chat que dividió las fases en subtareas atómicas secuenciales. Cada subtarea implementaría la colaboración e interacción entre los agentes.

El marco ChatDev se muestra en la imagen siguiente.

Artículos de investigación sobre agentes generativos que debe leer
El marco ChatDev propuesto (Quan et al., 2023)

Los investigadores realizan varios experimentos para medir el rendimiento del marco ChatDev en el desarrollo de software. Mediante el uso gpt3.5-turbo-16kA continuación se muestra el rendimiento del experimento de estadísticas del software.

Artículos de investigación sobre agentes generativos que debe leer
Estadísticas del software ChatDev Framework (Quan et al., 2023)

El número anterior es una métrica del análisis estadístico relacionado con los sistemas de software generados por ChatDev. Por ejemplo, se generan como mínimo 39 líneas de código y un máximo de 359 códigos. Los investigadores también demostraron que el 86.66% de los sistemas de software generados funcionaron correctamente.

Es un gran artículo que muestra el potencial para cambiar la forma en que trabajan los desarrolladores. Lea más el documento para comprender la implementación completa de ChatDev. El código completo también está disponible en ChatDev. repositorio.

2. AgentVerse: facilitar la colaboración entre múltiples agentes y explorar comportamientos emergentes en los agentes

AgentVerse es un marco propuesto en el artículo de Chen y otros., 2023 para simular los grupos de agentes a través del modelo de lenguaje grande para procedimientos dinámicos de resolución de problemas dentro del grupo y ajuste de los miembros del grupo en función de la progresión. Este estudio existe para resolver el desafío de la dinámica de grupo estática donde el agente autónomo no puede adaptarse y evolucionar en la resolución de problemas.

El marco AgentVerse intenta dividir el marco en cuatro pasos, que incluyen:

Reclutamiento de expertos: la fase de ajuste para que los agentes se alineen con el problema y la solución
Toma de decisiones colaborativa: los agentes discuten para formular una solución y una estrategia para resolver el problema.
Ejecución de acciones: los agentes ejecutan acciones en el entorno en función de la decisión.
Evaluación: Se evalúan la condición actual y los objetivos. La recompensa de retroalimentación volverá al primer paso si aún es necesario alcanzar el objetivo.

La estructura general de AgentVerse se muestra en la siguiente imagen.

Artículos de investigación sobre agentes generativos que debe leer
Marco AgentVerse (Chen et al., 2023)

Los investigadores experimentaron con el marco y compararon el marco AgentVerse con la solución de agente individual. El resultado se presenta en la imagen de abajo.

Artículos de investigación sobre agentes generativos que debe leer
Análisis de rendimiento de AgentVerse (Chen et al., 2023)

El marco AgentVerse generalmente puede superar a los agentes individuales en todas las tareas presentadas. Esto demuestra que los agentes generativos podrían funcionar mejor que los agentes individuales que intentan resolver problemas. Podrías probar el marco a través de su repositorio.

3. AgentSims: un entorno limitado de código abierto para la evaluación de modelos de lenguaje grandes

Evaluar la capacidad de los LLM sigue siendo una cuestión abierta dentro de la comunidad y los campos. Tres puntos que limitan la capacidad de evaluar LLM adecuadamente son las capacidades de evaluación limitadas por las tareas, los puntos de referencia vulnerables y las métricas no objetivas. Para manejar estos problemas, Lin et al., 2023 propusieron una evaluación basada en tareas como punto de referencia de LLM en su artículo. Se esperaba que este enfoque se convirtiera en estándar en la evaluación de los trabajos del LLM, ya que podría aliviar todos los problemas planteados. Para lograrlo, los investigadores introducen un marco llamado AgentSims.

AgentSims es un programa con infraestructura interactiva y de visualización para seleccionar tareas de evaluación para LLM. El objetivo general de AgentSims es proporcionar a investigadores y expertos una plataforma para agilizar el proceso de diseño de tareas y utilizarlas como herramienta de evaluación. La interfaz de AgentSims se presenta en la imagen a continuación.

Artículos de investigación sobre agentes generativos que debe leer
Interfaz de AgentSims (Lin et al., 2023)

Como el objetivo de AgentSims son todos los que requieren una evaluación LLM de manera más sencilla, los investigadores desarrollaron la interfaz donde podemos interactuar con la interfaz de usuario. También puedes probar la demostración completa en su página web del NDN Collective o accede al código completo en AgentSims repositorio.

Los agentes generativos son un enfoque reciente en los LLM para simular comportamientos humanos. Las últimas investigaciones de Park et al., 2023 ha mostrado una gran posibilidad de lo que podrían hacer los Agentes Generativos. Es por eso que han aparecido muchos tipos de investigaciones basadas en Agentes Generativos que han abierto muchas puertas nuevas.

En este artículo, hemos hablado de tres investigaciones diferentes sobre agentes generativos, que incluyen:

Documento sobre agentes comunicativos para el desarrollo de software (Quan et al., 2023)
AgentVerse: Facilitar la colaboración entre múltiples agentes y explorar comportamientos emergentes en los agentes (Chen y otros., 2023)

3. AgentSims: un entorno limitado de código abierto para la evaluación de modelos de lenguaje grandes (Lin et al., 2023)

Cornelio Yudha Wijaya es subgerente de ciencia de datos y escritor de datos. Mientras trabaja a tiempo completo en Allianz Indonesia, le encanta compartir consejos sobre Python y datos a través de las redes sociales y los medios de escritura.