Các tài liệu nghiên cứu về tác nhân sáng tạo bạn nên đọc - KDnuggets

Được xuất bản lại bởi Plato

Người theo dõi: 0

Tài liệu nghiên cứu tác nhân sáng tạo bạn nên đọc
Hình ảnh của siêu sao piki on Freepik

Tác nhân sáng tạo là một thuật ngữ được đặt ra bởi các nhà nghiên cứu của Đại học Stanford và Google trong bài báo của họ có tên Tác nhân sáng tạo: Mô phỏng tương tác về hành vi con người (Công viên et al., 2023). Trong bài báo này, nghiên cứu giải thích rằng Generative Agent là phần mềm tính toán mô phỏng hành vi của con người một cách đáng tin cậy.

Trong bài báo, họ giới thiệu cách các tác nhân có thể hành động giống như con người: viết, nấu ăn, nói, bỏ phiếu, ngủ, v.v., bằng cách triển khai một mô hình tổng quát, đặc biệt là Mô hình ngôn ngữ lớn (LLM). Các tác nhân có thể thể hiện khả năng đưa ra suy luận về bản thân, các tác nhân khác và môi trường của chúng bằng cách khai thác mô hình ngôn ngữ tự nhiên.

Nhà nghiên cứu xây dựng kiến trúc hệ thống để lưu trữ, tổng hợp và áp dụng các ký ức liên quan nhằm tạo ra hành vi đáng tin cậy bằng cách sử dụng mô hình ngôn ngữ lớn, cho phép tạo ra các tác nhân. Hệ thống này bao gồm ba thành phần, đó là:

Dòng bộ nhớ. Hệ thống ghi lại trải nghiệm của đại lý và là tài liệu tham khảo cho các hành động trong tương lai của đại lý.
Reflection. Hệ thống tổng hợp trải nghiệm thành ký ức để nhân viên học hỏi và hoạt động tốt hơn.
Lập kế hoạch. Hệ thống chuyển thông tin chuyên sâu từ hệ thống trước đó thành các kế hoạch hành động cấp cao và cho phép tác nhân phản ứng với môi trường.

Các hệ thống phản ánh và kế hoạch này hoạt động phối hợp với luồng bộ nhớ để tác động đến hành vi trong tương lai của tác nhân.

Để mô phỏng hệ thống trên, các nhà nghiên cứu tập trung vào việc tạo ra một xã hội tương tác của các tác nhân lấy cảm hứng từ trò chơi Sims. Kiến trúc ở trên được kết nối với ChatGPT và hiển thị thành công 25 tương tác của tổng đài viên trong hộp cát của họ. Một ví dụ về hoạt động của đại lý trong ngày được hiển thị trong hình ảnh bên dưới.

Tài liệu nghiên cứu tác nhân sáng tạo bạn nên đọc
Hoạt động và tương tác của Tác nhân sáng tạo suốt cả ngày (Park et al., 2023)

Toàn bộ mã để tạo Tác nhân sáng tạo và mô phỏng chúng trong hộp cát đã được các nhà nghiên cứu tạo thành nguồn mở. Bạn có thể tìm thấy mã này trong phần sau kho. Hướng dẫn đủ đơn giản để bạn có thể làm theo chúng mà không gặp nhiều vấn đề.

Với việc Generative Agents đang trở thành một lĩnh vực thú vị, nhiều nghiên cứu đang diễn ra dựa trên vấn đề này. Trong bài viết này, chúng ta sẽ khám phá nhiều bài viết về Generative Agent mà bạn nên đọc. Cái gì đây? Hãy đi sâu vào nó.

1. Tác nhân giao tiếp để phát triển phần mềm

Sản phẩm Tác nhân giao tiếp cho bài viết Phát triển phần mềm (Quan et al., 2023) là một cách tiếp cận mới nhằm cách mạng hóa việc phát triển phần mềm bằng cách sử dụng Generative Agent. Tiền đề mà các nhà nghiên cứu đề xuất là làm thế nào toàn bộ quá trình phát triển phần mềm có thể được sắp xếp hợp lý và thống nhất bằng cách sử dụng giao tiếp ngôn ngữ tự nhiên từ Mô hình ngôn ngữ lớn (LLM). Các nhiệm vụ bao gồm phát triển mã, tạo tài liệu, phân tích các yêu cầu và nhiều nhiệm vụ khác.

Các nhà nghiên cứu chỉ ra rằng việc tạo ra toàn bộ phần mềm bằng LLM có hai thách thức lớn: ảo giác và thiếu kiểm tra chéo trong quá trình ra quyết định. Để giải quyết những vấn đề này, các nhà nghiên cứu đề xuất khung phát triển phần mềm dựa trên trò chuyện có tên là ChatDev.

Khung ChatDev tuân theo bốn giai đoạn: thiết kế, mã hóa, thử nghiệm và ghi tài liệu. Trong mỗi giai đoạn, ChatDev sẽ thiết lập một số tác nhân với nhiều vai trò khác nhau, chẳng hạn như người đánh giá mã, lập trình viên phần mềm, v.v. Để đảm bảo giao tiếp giữa các tác nhân diễn ra suôn sẻ, các nhà nghiên cứu đã phát triển một chuỗi trò chuyện chia các giai đoạn thành các nhiệm vụ phụ nguyên tử tuần tự. Mỗi nhiệm vụ phụ sẽ thực hiện sự cộng tác và tương tác giữa các tác nhân.

Khung ChatDev được hiển thị trong hình ảnh bên dưới.

Tài liệu nghiên cứu tác nhân sáng tạo bạn nên đọc
Khung ChatDev được đề xuất (Quan et al., 2023)

Các nhà nghiên cứu thực hiện nhiều thử nghiệm khác nhau để đo lường hiệu quả hoạt động của khung ChatDev trong quá trình phát triển phần mềm. Bằng cách sử dụng gpt3.5-turbo-16k, bên dưới là hiệu suất thử nghiệm thống kê phần mềm.

Tài liệu nghiên cứu tác nhân sáng tạo bạn nên đọc
Thống kê phần mềm ChatDev Framework (Quan et al., 2023)

Con số trên là số liệu phân tích thống kê liên quan đến hệ thống phần mềm do ChatDev tạo ra. Ví dụ: tối thiểu 39 dòng mã được tạo và tối đa là 359 mã. Các nhà nghiên cứu cũng chỉ ra rằng 86.66% hệ thống phần mềm được tạo ra hoạt động bình thường.

Đó là một bài viết tuyệt vời cho thấy tiềm năng thay đổi cách các nhà phát triển làm việc. Đọc thêm bài viết để hiểu cách triển khai đầy đủ của ChatDev. Mã đầy đủ cũng có sẵn trong ChatDev kho.

2. AgentVerse: Tạo điều kiện cho sự hợp tác giữa nhiều tác nhân và khám phá các hành vi mới nổi trong các tác nhân

AgentVerse là một framework được đề xuất trong bài báo bởi Chen và cộng sự., 2023 để mô phỏng các nhóm đặc vụ thông qua Mô hình ngôn ngữ lớn nhằm tạo ra các quy trình giải quyết vấn đề linh hoạt trong nhóm và điều chỉnh các thành viên nhóm dựa trên tiến trình. Nghiên cứu này tồn tại để giải quyết thách thức về động lực nhóm tĩnh trong đó tác nhân tự trị không thể thích ứng và phát triển trong việc giải quyết vấn đề.

Khung AgentVerse cố gắng chia khung thành bốn bước, bao gồm:

Tuyển dụng chuyên gia: Giai đoạn điều chỉnh để các đại lý phù hợp với vấn đề và giải pháp
Ra quyết định hợp tác: Các tác nhân thảo luận để xây dựng giải pháp và chiến lược giải quyết vấn đề.
Thực thi hành động: Các tác nhân thực hiện hành động trong môi trường dựa trên quyết định.
Đánh giá: Điều kiện và mục tiêu hiện tại được đánh giá. Phần thưởng phản hồi sẽ quay lại bước đầu tiên nếu vẫn cần đạt được mục tiêu.

Cấu trúc tổng thể của AgentVerse được hiển thị trong hình bên dưới.

Tài liệu nghiên cứu tác nhân sáng tạo bạn nên đọc
Khung AgentVerse (Chen et al., 2023)

Các nhà nghiên cứu đã thử nghiệm khung và so sánh khung AgentVerse với giải pháp tác nhân riêng lẻ. Kết quả được trình bày trong hình ảnh dưới đây.

Tài liệu nghiên cứu tác nhân sáng tạo bạn nên đọc
Phân tích hiệu suất của AgentVerse (Chen et al., 2023)

Khung AgentVerse nhìn chung có thể hoạt động tốt hơn các tác nhân riêng lẻ trong tất cả các nhiệm vụ được trình bày. Điều này chứng tỏ rằng các tác nhân tạo sinh có thể hoạt động tốt hơn các tác nhân riêng lẻ đang cố gắng giải quyết vấn đề. Bạn có thể thử khuôn khổ này thông qua kho.

3. AgentSims: Hộp cát nguồn mở để đánh giá mô hình ngôn ngữ lớn

Đánh giá khả năng của LLM vẫn là một câu hỏi mở trong cộng đồng và các lĩnh vực. Ba điểm hạn chế khả năng đánh giá LLM đúng cách là khả năng đánh giá hạn chế theo nhiệm vụ, điểm chuẩn dễ bị tổn thương và các số liệu không khách quan. Để xử lý những vấn đề này, Lin et al., 2023 đề xuất đánh giá dựa trên nhiệm vụ làm điểm chuẩn LLM trong bài báo của họ. Cách tiếp cận này hy vọng sẽ trở thành tiêu chuẩn trong việc đánh giá công việc của LLM vì nó có thể giảm bớt tất cả các vấn đề nảy sinh. Để đạt được điều này, các nhà nghiên cứu giới thiệu một khuôn khổ có tên AgentSims.

AgentSims là một chương trình có cơ sở hạ tầng tương tác và trực quan để quản lý các nhiệm vụ đánh giá cho LLM. Mục tiêu tổng thể của AgentSims là cung cấp cho các nhà nghiên cứu và chuyên gia một nền tảng để hợp lý hóa quy trình thiết kế nhiệm vụ và sử dụng chúng làm công cụ đánh giá. Mặt trước của AgentSims được trình bày trong hình ảnh bên dưới.

Tài liệu nghiên cứu tác nhân sáng tạo bạn nên đọc
Giao diện người dùng AgentSims (Lin et al., 2023)

Vì mục tiêu của AgentSims là tất cả những người yêu cầu đánh giá LLM theo những cách dễ dàng hơn nên các nhà nghiên cứu đã phát triển giao diện người dùng nơi chúng tôi có thể tương tác với giao diện người dùng. Bạn cũng có thể thử bản demo đầy đủ trên trang mạng hoặc truy cập mã đầy đủ trong AgentSims kho.

Tác nhân sáng tạo là một cách tiếp cận gần đây trong LLM để mô phỏng hành vi của con người. Nghiên cứu mới nhất của Park et al., năm 2023 đã cho thấy khả năng rất lớn về những gì Generative Agent có thể làm. Đó là lý do tại sao nhiều loại hình nghiên cứu dựa trên Generative Agent đã xuất hiện và mở ra nhiều cánh cửa mới.

Trong bài viết này, chúng tôi đã nói về ba nghiên cứu về Tác nhân sáng tạo khác nhau, bao gồm:

Tác nhân giao tiếp cho bài viết Phát triển phần mềm (Quân et al., 2023)
AgentVerse: Tạo điều kiện cho sự hợp tác giữa nhiều tác nhân và khám phá các hành vi mới nổi trong các tác nhân (Chen và cộng sự., 2023)

3. AgentSims: Hộp cát nguồn mở để đánh giá mô hình ngôn ngữ lớn (Lin et al., 2023)

Cornellius Yudha Wijaya là trợ lý quản lý khoa học dữ liệu và người viết dữ liệu. Trong khi làm việc toàn thời gian tại Allianz Indonesia, anh ấy thích chia sẻ các mẹo về Python và Dữ liệu qua mạng xã hội và phương tiện viết lách.