เอกสารการวิจัยตัวแทน Generative ที่คุณควรอ่าน - KDnuggets

เอกสารการวิจัยตัวแทน Generative ที่คุณควรอ่าน - KDnuggets

โหนดต้นทาง: 2903173

เอกสารการวิจัยตัวแทนเจนเนอเรชั่นที่คุณควรอ่าน
ภาพโดย พิกิซุปเปอร์สตาร์ on Freepik
 

Generative Agents เป็นคำที่มหาวิทยาลัยสแตนฟอร์ดและนักวิจัยของ Google บัญญัติไว้ในรายงานที่เรียกว่า ตัวแทนกำเนิด: Simulacra แบบโต้ตอบของพฤติกรรมมนุษย์ (สวน อัล et., 2023) ในบทความนี้ การวิจัยอธิบายว่า Generative Agent เป็นซอฟต์แวร์คำนวณที่จำลองพฤติกรรมของมนุษย์ได้อย่างน่าเชื่อถือ 

ในบทความนี้ พวกเขาแนะนำว่าตัวแทนสามารถทำหน้าที่เหมือนมนุษย์ได้อย่างไร เช่น การเขียน การทำอาหาร การพูด การลงคะแนนเสียง การนอนหลับ ฯลฯ โดยการนำแบบจำลองกำเนิดไปใช้ โดยเฉพาะโมเดลภาษาขนาดใหญ่ (LLM) เจ้าหน้าที่สามารถแสดงความสามารถในการอนุมานเกี่ยวกับตนเอง เจ้าหน้าที่อื่นๆ และสภาพแวดล้อมของพวกเขาโดยการควบคุมแบบจำลองภาษาธรรมชาติ

ผู้วิจัยสร้างสถาปัตยกรรมระบบเพื่อจัดเก็บ สังเคราะห์ และใช้ความทรงจำที่เกี่ยวข้องเพื่อสร้างพฤติกรรมที่น่าเชื่อโดยใช้แบบจำลองภาษาขนาดใหญ่ ทำให้เกิดการสร้างได้ ระบบนี้ประกอบด้วยสามองค์ประกอบ ได้แก่:

  1. สตรีมหน่วยความจำ. ระบบจะบันทึกประสบการณ์ของตัวแทนและเป็นข้อมูลอ้างอิงสำหรับการดำเนินการในอนาคตของตัวแทน
  2. การสะท้อน. ระบบจะสังเคราะห์ประสบการณ์ให้เป็นความทรงจำเพื่อให้ตัวแทนได้เรียนรู้และทำงานได้ดีขึ้น
  3. การวางแผน. ระบบจะแปลข้อมูลเชิงลึกจากระบบก่อนหน้าให้เป็นแผนปฏิบัติการระดับสูง และช่วยให้ตัวแทนตอบสนองต่อสภาพแวดล้อมได้ 

ระบบการไตร่ตรองและวางแผนเหล่านี้ทำงานประสานกันกับสตรีมหน่วยความจำเพื่อมีอิทธิพลต่อพฤติกรรมในอนาคตของเอเจนต์ 

เพื่อจำลองระบบข้างต้น นักวิจัยมุ่งเน้นไปที่การสร้างสังคมโต้ตอบของตัวแทนที่ได้รับแรงบันดาลใจจากเกมเดอะซิมส์ สถาปัตยกรรมด้านบนเชื่อมต่อกับ ChatGPT และแสดงการโต้ตอบของตัวแทน 25 รายการภายในแซนด์บ็อกซ์ได้สำเร็จ ตัวอย่างกิจกรรมของตัวแทนตลอดทั้งวันแสดงอยู่ในภาพด้านล่าง

 

เอกสารการวิจัยตัวแทนเจนเนอเรชั่นที่คุณควรอ่าน
กิจกรรม Generative Agent และการโต้ตอบตลอดทั้งวัน (ปาร์ค อัล et., 2023)
 

โค้ดทั้งหมดสำหรับสร้าง Generative Agent และจำลองในแซนด์บ็อกซ์นั้นเป็นโอเพ่นซอร์สโดยนักวิจัย ซึ่งคุณสามารถพบได้ในส่วนต่อไปนี้ กรุ. ทิศทางนั้นง่ายพอที่จะติดตามได้โดยไม่มีปัญหามากนัก

เมื่อ Generative Agents กลายเป็นสาขาที่น่าตื่นเต้น การวิจัยจำนวนมากจึงเกิดขึ้นจากสิ่งนี้ ในบทความนี้ เราจะสำรวจเอกสาร Generative Agents ต่างๆ ที่คุณควรอ่าน สิ่งเหล่านี้คืออะไร? เรามาเข้าเรื่องกันเถอะ

1. ตัวแทนการสื่อสารเพื่อการพัฒนาซอฟต์แวร์

พื้นที่ เอกสารตัวแทนการสื่อสารเพื่อการพัฒนาซอฟต์แวร์ (ควอน เอตอัล, 2023) คือแนวทางใหม่ในการปฏิวัติการพัฒนาซอฟต์แวร์โดยใช้ Generative Agents สมมติฐานที่นักวิจัยเสนอคือวิธีที่กระบวนการพัฒนาซอฟต์แวร์ทั้งหมดสามารถปรับปรุงและเป็นหนึ่งเดียวโดยใช้การสื่อสารภาษาธรรมชาติจาก Large Language Models (LLM) งานต่างๆ ได้แก่ การพัฒนาโค้ด การสร้างเอกสาร การวิเคราะห์ข้อกำหนด และอื่นๆ อีกมากมาย

นักวิจัยชี้ให้เห็นว่าการสร้างซอฟต์แวร์ทั้งหมดโดยใช้ LLM มีความท้าทายที่สำคัญสองประการ: ภาพหลอนและการขาดการตรวจสอบในการตัดสินใจ เพื่อแก้ไขปัญหาเหล่านี้ นักวิจัยเสนอกรอบการพัฒนาซอฟต์แวร์แบบแชทที่เรียกว่า ChatDev

เฟรมเวิร์ก ChatDev มีสี่ขั้นตอน: การออกแบบ การเขียนโค้ด การทดสอบ และการจัดทำเอกสาร ในแต่ละระยะ ChatDev จะสร้างเอเจนต์หลายตัวที่มีบทบาทต่างกัน เช่น ผู้ตรวจสอบโค้ด โปรแกรมเมอร์ซอฟต์แวร์ ฯลฯ เพื่อให้มั่นใจว่าการสื่อสารระหว่างเอเจนต์ดำเนินไปอย่างราบรื่น นักวิจัยได้พัฒนากลุ่มแชทที่แบ่งเฟสออกเป็นงานย่อยของอะตอมตามลำดับ งานย่อยแต่ละงานจะใช้การทำงานร่วมกันและการมีปฏิสัมพันธ์ระหว่างตัวแทน

กรอบงาน ChatDev แสดงอยู่ในภาพด้านล่าง

 

เอกสารการวิจัยตัวแทนเจนเนอเรชั่นที่คุณควรอ่าน
กรอบ ChatDev ที่เสนอ (Quan เอตอัล, 2023)
 

นักวิจัยทำการทดลองต่างๆ เพื่อวัดว่าเฟรมเวิร์ก ChatDev ทำงานอย่างไรในการพัฒนาซอฟต์แวร์ โดยใช้ gpt3.5-เทอร์โบ-16kด้านล่างคือประสิทธิภาพการทดสอบสถิติซอฟต์แวร์

 

เอกสารการวิจัยตัวแทนเจนเนอเรชั่นที่คุณควรอ่าน
สถิติซอฟต์แวร์กรอบงาน ChatDev (Quan เอตอัล, 2023)
 

ตัวเลขข้างต้นเป็นตัวชี้วัดในการวิเคราะห์ทางสถิติเกี่ยวกับระบบซอฟต์แวร์ที่สร้างโดย ChatDev ตัวอย่างเช่น มีการสร้างโค้ดอย่างน้อย 39 บรรทัด โดยสูงสุดคือ 359 บรรทัด นักวิจัยยังแสดงให้เห็นว่า 86.66% ของระบบซอฟต์แวร์ที่สร้างขึ้นทำงานได้อย่างถูกต้อง

เป็นรายงานที่ยอดเยี่ยมที่แสดงให้เห็นถึงศักยภาพในการเปลี่ยนแปลงวิธีการทำงานของนักพัฒนา อ่านบทความนี้เพิ่มเติมเพื่อทำความเข้าใจการใช้งาน ChatDev อย่างเต็มรูปแบบ รหัสเต็มยังมีอยู่ใน ChatDev กรุ.

2. AgentVerse: อำนวยความสะดวกในการทำงานร่วมกันของตัวแทนหลายรายและการสำรวจพฤติกรรมฉุกเฉินในตัวแทน

AgentVerse เป็นเฟรมเวิร์กที่เสนอในรายงานโดย เฉินและคณะ. 2023 เพื่อจำลองกลุ่มตัวแทนผ่านโมเดลภาษาขนาดใหญ่ไปจนถึงขั้นตอนการแก้ปัญหาแบบไดนามิกภายในกลุ่มและการปรับเปลี่ยนสมาชิกกลุ่มตามความก้าวหน้า การศึกษานี้มีขึ้นเพื่อแก้ปัญหาความท้าทายของพลวัตของกลุ่มคงที่ซึ่งตัวแทนอัตโนมัติไม่สามารถปรับตัวและพัฒนาในการแก้ปัญหาได้

เฟรมเวิร์ก AgentVerse พยายามแบ่งเฟรมเวิร์กออกเป็นสี่ขั้นตอน ได้แก่: 

  1. การสรรหาผู้เชี่ยวชาญ: ขั้นตอนการปรับตัวแทนให้สอดคล้องกับปัญหาและแนวทางแก้ไข
  2. การตัดสินใจร่วมกัน: ตัวแทนหารือกันเพื่อกำหนดแนวทางแก้ไขและกลยุทธ์ในการแก้ปัญหา 
  3. การดำเนินการดำเนินการ: ตัวแทนดำเนินการดำเนินการในสภาพแวดล้อมตามการตัดสินใจ
  4. การประเมินผล: มีการประเมินสภาพปัจจุบันและเป้าหมาย รางวัลคำติชมจะกลับไปยังขั้นตอนแรกหากยังคงต้องบรรลุเป้าหมาย

โครงสร้างโดยรวมของ AgentVerse แสดงอยู่ในรูปภาพด้านล่าง

 

เอกสารการวิจัยตัวแทนเจนเนอเรชั่นที่คุณควรอ่าน
กรอบงาน AgentVerse (เฉิน เอตอัล, 2023)
 

นักวิจัยทดลองกับเฟรมเวิร์กและเปรียบเทียบเฟรมเวิร์ก AgentVerse กับโซลูชันเอเจนต์แต่ละรายการ ผลลัพธ์จะแสดงในภาพด้านล่าง

 

เอกสารการวิจัยตัวแทนเจนเนอเรชั่นที่คุณควรอ่าน
การวิเคราะห์ประสิทธิภาพของ AgentVerse (Chen เอตอัล, 2023)
 

โดยทั่วไป เฟรมเวิร์ก AgentVerse สามารถทำงานได้ดีกว่าเอเจนต์แต่ละรายในงานที่นำเสนอทั้งหมด นี่เป็นการพิสูจน์ว่า generative agent สามารถทำงานได้ดีกว่าตัวแทนแต่ละรายที่พยายามแก้ไขปัญหา คุณสามารถลองใช้กรอบงานผ่านพวกเขาได้ กรุ.

3. AgentSims: แซนด์บ็อกซ์โอเพ่นซอร์สสำหรับการประเมินโมเดลภาษาขนาดใหญ่

การประเมินความสามารถของ LLM ยังคงเป็นคำถามเปิดในชุมชนและภาคสนาม ประเด็นสามประการที่จำกัดความสามารถในการประเมิน LLM อย่างเหมาะสมคือความสามารถในการประเมินที่จำกัดตามงาน เกณฑ์มาตรฐานที่มีช่องโหว่ และตัวชี้วัดที่ไม่เป็นรูปธรรม เพื่อจัดการกับปัญหาเหล่านี้ หลิน เอตอัล, 2023 เสนอการประเมินตามงานเป็นเกณฑ์มาตรฐาน LLM ในรายงานของพวกเขา แนวทางนี้หวังว่าจะกลายเป็นมาตรฐานในการประเมินงานของ LLM เนื่องจากสามารถบรรเทาปัญหาทั้งหมดที่เกิดขึ้นได้ เพื่อให้บรรลุเป้าหมายนี้ นักวิจัยได้แนะนำกรอบการทำงานที่เรียกว่า AgentSims

AgentSims เป็นโปรแกรมที่มีโครงสร้างพื้นฐานเชิงโต้ตอบและการแสดงภาพสำหรับดูแลงานการประเมินสำหรับ LLM วัตถุประสงค์โดยรวมของ AgentSims คือเพื่อให้นักวิจัยและผู้เชี่ยวชาญมีแพลตฟอร์มเพื่อปรับปรุงกระบวนการออกแบบงาน และใช้เป็นเครื่องมือในการประเมินผล ส่วนหน้าของ AgentSims แสดงอยู่ในภาพด้านล่าง

 

เอกสารการวิจัยตัวแทนเจนเนอเรชั่นที่คุณควรอ่าน
ส่วนหน้าของ AgentSims (Lin เอตอัล, 2023)
 

เนื่องจากเป้าหมายสำหรับ AgentSims คือทุกคนที่ต้องการการประเมิน LLM ด้วยวิธีที่ง่ายกว่า นักวิจัยจึงพัฒนาส่วนหน้าซึ่งเราสามารถโต้ตอบกับ UI ได้ คุณยังสามารถลองสาธิตแบบเต็มได้ เว็บไซต์ หรือเข้าถึงรหัสเต็มใน AgentSims กรุ.

Generative Agents เป็นแนวทางล่าสุดใน LLM เพื่อจำลองพฤติกรรมของมนุษย์ ผลการวิจัยล่าสุดโดยปาร์ค อัล et., ปี 2023 ได้แสดงให้เห็นความเป็นไปได้อย่างมากว่า Generative Agents จะทำอะไรได้บ้าง นั่นคือเหตุผลที่งานวิจัยหลายประเภทเกี่ยวกับ Generative Agents ได้ปรากฏตัวและเปิดประตูใหม่ๆ มากมาย

ในบทความนี้ เราได้พูดคุยเกี่ยวกับการวิจัย Generative Agents ที่แตกต่างกัน XNUMX ประการ ได้แก่:

  1. เอกสารตัวแทนการสื่อสารเพื่อการพัฒนาซอฟต์แวร์ (Quan เอตอัล, 2023)
  2. AgentVerse: อำนวยความสะดวกในการทำงานร่วมกันหลายตัวแทนและการสำรวจพฤติกรรมฉุกเฉินในตัวแทน (เฉินและคณะ. 2023)

3. AgentSims: แซนด์บ็อกซ์โอเพ่นซอร์สสำหรับการประเมินโมเดลภาษาขนาดใหญ่ (หลิน เอตอัล, 2023)
 
 
คอร์เนลเลียส ยุธา วิชายา เป็นผู้ช่วยผู้จัดการด้านวิทยาศาสตร์ข้อมูลและผู้เขียนข้อมูล ในขณะที่ทำงานเต็มเวลาที่ Allianz Indonesia เขาชอบแบ่งปันเคล็ดลับ Python และ Data ผ่านโซเชียลมีเดียและสื่อการเขียน
 

ประทับเวลา:

เพิ่มเติมจาก KD นักเก็ต