읽어야 할 생성 에이전트 연구 논문 - KDnuggets

플라톤에 의해 재발행

팔로워 : 0

읽어야 할 생성 에이전트 연구 논문
이미지로 피키수퍼스타 on Freepik

생성 에이전트(Generative Agents)는 스탠포드 대학교와 Google 연구원들이 다음과 같은 논문에서 만든 용어입니다. 생성 에이전트: 인간 행동의 대화형 시뮬레이션 (공원 외., 2023). 이 논문에서 연구에서는 생성 에이전트(Generative Agents)가 인간 행동을 믿을만하게 시뮬레이션하는 계산 소프트웨어라고 설명합니다.

이 논문에서는 생성 모델, 특히 LLM(대형 언어 모델)을 구현하여 에이전트가 쓰기, 요리, 말하기, 투표, 수면 등 인간이 하는 것과 같이 행동할 수 있는 방법을 소개합니다. 에이전트는 자연어 모델을 활용하여 자신, 다른 에이전트 및 환경에 대해 추론하는 기능을 보여줄 수 있습니다.

연구원은 생성 에이전트를 활성화하는 대규모 언어 모델을 사용하여 믿을 수 있는 행동을 생성하기 위해 관련 기억을 저장, 합성 및 적용하는 시스템 아키텍처를 구축합니다. 이 시스템은 세 가지 구성 요소로 구성됩니다.

메모리 스트림. 시스템은 에이전트의 경험을 기록하고 에이전트의 향후 작업에 대한 참조입니다.
반사. 시스템은 에이전트가 더 잘 배우고 수행할 수 있도록 경험을 메모리로 합성합니다.
계획. 시스템은 이전 시스템의 통찰력을 높은 수준의 조치 계획으로 변환하고 상담원이 환경에 반응할 수 있도록 합니다.

이러한 반영 및 계획 시스템은 메모리 스트림과 시너지 효과를 발휘하여 에이전트의 향후 동작에 영향을 미칩니다.

위의 시스템을 시뮬레이션하기 위해 연구원들은 Sims 게임에서 영감을 받은 대화형 에이전트 사회를 만드는 데 중점을 둡니다. 위의 아키텍처는 ChatGPT와 연결되어 있으며 샌드박스 내에서 25개의 에이전트 상호 작용을 성공적으로 보여줍니다. 하루 종일 에이전트 활동의 예가 아래 이미지에 표시됩니다.

읽어야 할 생성 에이전트 연구 논문
하루 종일 생성 에이전트 활동 및 상호 작용(박 외., 2023)

생성 에이전트를 생성하고 샌드박스에서 시뮬레이션하는 전체 코드는 이미 연구원에 의해 오픈 소스로 만들어졌으며 다음에서 찾을 수 있습니다. 저장소. 방향이 간단해서 큰 어려움 없이 따라갈 수 있습니다.

생성 에이전트(Generative Agent)가 흥미로운 분야로 떠오르면서 이를 기반으로 한 많은 연구가 진행되고 있습니다. 이 기사에서는 읽어야 할 다양한 Generative Agents 논문을 살펴보겠습니다. 이것들은 무엇입니까? 그것에 들어가 보자.

1. 소프트웨어 개발을 위한 의사소통 에이전트

XNUMXD덴탈의 소프트웨어 개발을 위한 통신 에이전트 문서 (콴 et al., 2023)은 Generative Agent를 사용하여 소프트웨어 개발을 혁신하는 새로운 접근 방식입니다. 연구자들이 제안하는 전제는 LLM(Large Language Models)의 자연어 통신을 사용하여 전체 소프트웨어 개발 프로세스를 간소화하고 통합할 수 있는 방법입니다. 작업에는 코드 개발, 문서 생성, 요구 사항 분석 등이 포함됩니다.

연구원들은 LLM을 사용하여 전체 소프트웨어를 생성하면 환각과 의사 결정 시 교차 조사 부족이라는 두 가지 주요 과제가 있음을 지적합니다. 이러한 문제를 해결하기 위해 연구원들은 ChatDev라는 채팅 기반 소프트웨어 개발 프레임워크를 제안합니다.

ChatDev 프레임워크는 설계, 코딩, 테스트 및 문서화의 네 단계를 따릅니다. 각 단계에서 ChatDev는 코드 검토자, 소프트웨어 프로그래머 등과 같은 다양한 역할을 가진 여러 에이전트를 설정합니다. 에이전트 간의 통신이 원활하게 실행되도록 하기 위해 연구원은 단계를 순차적인 원자 하위 작업으로 나누는 채팅 체인을 개발했습니다. 각 하위 작업은 에이전트 간의 협업과 상호 작용을 구현합니다.

ChatDev 프레임워크는 아래 이미지에 표시되어 있습니다.

읽어야 할 생성 에이전트 연구 논문
제안된 ChatDev 프레임워크(Quan et al., 2023)

연구원들은 ChatDev 프레임워크가 소프트웨어 개발에서 어떻게 작동하는지 측정하기 위해 다양한 실험을 수행합니다. 사용하여 gpt3.5-터보-16k, 아래는 소프트웨어 통계 실험 성능입니다.

읽어야 할 생성 에이전트 연구 논문
ChatDev 프레임워크 소프트웨어 통계(Quan et al., 2023)

위 수치는 ChatDev가 생성한 소프트웨어 시스템에 대한 통계적 분석에 대한 지표입니다. 예를 들어, 최소 39줄의 코드가 생성되고 최대 359줄의 코드가 생성됩니다. 연구원들은 또한 생성된 소프트웨어 시스템의 86.66%가 제대로 작동한다는 것을 보여주었습니다.

개발자의 작업 방식을 바꿀 수 있는 잠재력을 보여주는 훌륭한 문서입니다. ChatDev의 전체 구현을 이해하려면 문서를 자세히 읽어보세요. 전체 코드는 ChatDev에서도 볼 수 있습니다. 저장소.

2. AgentVerse: 다중 에이전트 협업 촉진 및 에이전트의 새로운 동작 탐색

AgentVerse는 논문에서 제안된 프레임워크입니다. 첸 등., 2023 대규모 언어 모델을 통해 에이전트 그룹을 시뮬레이션하여 그룹 내 동적 문제 해결 절차와 진행 상황에 따른 그룹 구성원 조정을 시뮬레이션합니다. 이 연구는 자율 에이전트가 문제 해결에 적응하고 진화할 수 없는 정적 그룹 역학의 문제를 해결하기 위해 존재합니다.

AgentVerse 프레임워크는 프레임워크를 다음을 포함하는 네 단계로 분할하려고 합니다.

전문가 모집: 상담원이 문제와 해결책에 부합하도록 조정하는 단계
협업적 의사 결정: 상담원은 문제 해결을 위한 솔루션과 전략을 수립하기 위해 논의합니다.
행동 실행(Action Execution): 에이전트는 결정에 따라 환경에서 행동을 실행합니다.
평가: 현재 상태와 목표를 평가합니다. 목표를 여전히 달성해야 하는 경우 피드백 보상은 첫 번째 단계로 돌아갑니다.

AgentVerse의 전체 구조는 아래 이미지에 표시됩니다.

읽어야 할 생성 에이전트 연구 논문
AgentVerse 프레임워크(첸 et al., 2023)

연구원들은 프레임워크를 실험하고 AgentVerse 프레임워크를 개별 에이전트 솔루션과 비교했습니다. 결과는 아래 이미지에 나와 있습니다.

읽어야 할 생성 에이전트 연구 논문
AgentVerse 성능 분석(Chen et al., 2023)

AgentVerse 프레임워크는 일반적으로 제시된 모든 작업에서 개별 에이전트보다 성능이 뛰어납니다. 이는 생성 에이전트가 문제를 해결하려는 개별 에이전트보다 더 나은 성능을 발휘할 수 있음을 증명합니다. 다음을 통해 프레임워크를 시험해 볼 수 있습니다. 저장소.

3. AgentSims: 대규모 언어 모델 평가를 위한 오픈 소스 샌드박스

LLM의 능력을 평가하는 것은 커뮤니티와 현장 내에서 여전히 공개 질문입니다. LLM을 올바르게 평가하는 능력을 제한하는 세 가지 점은 작업, 취약한 벤치마크 및 객관적이지 않은 측정 기준에 의한 제한된 평가 능력입니다. 이러한 문제를 처리하기 위해, 린 et al., 2023 논문에서 LLM 벤치마크로 작업 기반 평가를 제안했습니다. 이러한 접근 방식은 제기된 모든 문제를 완화할 수 있으므로 LLM의 작업을 평가하는 데 표준이 되기를 바랐습니다. 이를 달성하기 위해 연구원들은 AgentSims라는 프레임워크를 도입했습니다.

AgentSims는 LLM 평가 작업을 선별하기 위한 대화형 시각화 인프라를 갖춘 프로그램입니다. AgentSims의 전반적인 목표는 연구원과 전문가에게 작업 설계 프로세스를 간소화하고 이를 평가 도구로 사용할 수 있는 플랫폼을 제공하는 것입니다. AgentSims의 프런트 엔드는 아래 이미지에 표시됩니다.

읽어야 할 생성 에이전트 연구 논문
AgentSims 프런트엔드(Lin et al., 2023)

AgentSims의 대상은 더 쉬운 방법으로 LLM 평가가 필요한 모든 사람이기 때문에 연구원들은 UI와 상호 작용할 수 있는 프런트 엔드를 개발했습니다. 다음 사이트에서 전체 데모를 사용해 볼 수도 있습니다. 웹 사이트 또는 AgentSims의 전체 코드에 액세스하세요 저장소.

생성 에이전트는 인간 행동을 시뮬레이션하기 위한 LLM의 최근 접근 방식입니다. 박 교수의 최신 연구 외., 2023년은 Generative Agent가 무엇을 할 수 있는지에 대한 큰 가능성을 보여주었습니다. 그렇기 때문에 생성 에이전트를 기반으로 한 다양한 유형의 연구가 나타나고 많은 새로운 문이 열렸습니다.

이 기사에서 우리는 다음을 포함하여 세 가지 다른 생성 에이전트 연구에 대해 이야기했습니다.

소프트웨어 개발을 위한 통신 에이전트 문서(콴 et al., 2023)
AgentVerse: 다중 에이전트 협업 촉진 및 에이전트의 새로운 동작 탐색(첸 등., 2023)

3. AgentSims: 대규모 언어 모델 평가를 위한 오픈 소스 샌드박스(린 et al., 2023)

코넬리우스 유다 위자야 데이터 과학 보조 관리자 및 데이터 작성자입니다. Allianz Indonesia에서 풀타임으로 일하는 동안 그는 소셜 미디어와 글쓰기 미디어를 통해 Python 및 데이터 팁을 공유하는 것을 좋아합니다.