ภาพโดย พิกิซุปเปอร์สตาร์ on Freepik
Generative Agents เป็นคำที่มหาวิทยาลัยสแตนฟอร์ดและนักวิจัยของ Google บัญญัติไว้ในรายงานที่เรียกว่า ตัวแทนกำเนิด: Simulacra แบบโต้ตอบของพฤติกรรมมนุษย์ (สวน อัล et., 2023) ในบทความนี้ การวิจัยอธิบายว่า Generative Agent เป็นซอฟต์แวร์คำนวณที่จำลองพฤติกรรมของมนุษย์ได้อย่างน่าเชื่อถือ
ในบทความนี้ พวกเขาแนะนำว่าตัวแทนสามารถทำหน้าที่เหมือนมนุษย์ได้อย่างไร เช่น การเขียน การทำอาหาร การพูด การลงคะแนนเสียง การนอนหลับ ฯลฯ โดยการนำแบบจำลองกำเนิดไปใช้ โดยเฉพาะโมเดลภาษาขนาดใหญ่ (LLM) เจ้าหน้าที่สามารถแสดงความสามารถในการอนุมานเกี่ยวกับตนเอง เจ้าหน้าที่อื่นๆ และสภาพแวดล้อมของพวกเขาโดยการควบคุมแบบจำลองภาษาธรรมชาติ
ผู้วิจัยสร้างสถาปัตยกรรมระบบเพื่อจัดเก็บ สังเคราะห์ และใช้ความทรงจำที่เกี่ยวข้องเพื่อสร้างพฤติกรรมที่น่าเชื่อโดยใช้แบบจำลองภาษาขนาดใหญ่ ทำให้เกิดการสร้างได้ ระบบนี้ประกอบด้วยสามองค์ประกอบ ได้แก่:
- สตรีมหน่วยความจำ. ระบบจะบันทึกประสบการณ์ของตัวแทนและเป็นข้อมูลอ้างอิงสำหรับการดำเนินการในอนาคตของตัวแทน
- การสะท้อน. ระบบจะสังเคราะห์ประสบการณ์ให้เป็นความทรงจำเพื่อให้ตัวแทนได้เรียนรู้และทำงานได้ดีขึ้น
- การวางแผน. ระบบจะแปลข้อมูลเชิงลึกจากระบบก่อนหน้าให้เป็นแผนปฏิบัติการระดับสูง และช่วยให้ตัวแทนตอบสนองต่อสภาพแวดล้อมได้
ระบบการไตร่ตรองและวางแผนเหล่านี้ทำงานประสานกันกับสตรีมหน่วยความจำเพื่อมีอิทธิพลต่อพฤติกรรมในอนาคตของเอเจนต์
เพื่อจำลองระบบข้างต้น นักวิจัยมุ่งเน้นไปที่การสร้างสังคมโต้ตอบของตัวแทนที่ได้รับแรงบันดาลใจจากเกมเดอะซิมส์ สถาปัตยกรรมด้านบนเชื่อมต่อกับ ChatGPT และแสดงการโต้ตอบของตัวแทน 25 รายการภายในแซนด์บ็อกซ์ได้สำเร็จ ตัวอย่างกิจกรรมของตัวแทนตลอดทั้งวันแสดงอยู่ในภาพด้านล่าง
กิจกรรม Generative Agent และการโต้ตอบตลอดทั้งวัน (ปาร์ค อัล et., 2023)
โค้ดทั้งหมดสำหรับสร้าง Generative Agent และจำลองในแซนด์บ็อกซ์นั้นเป็นโอเพ่นซอร์สโดยนักวิจัย ซึ่งคุณสามารถพบได้ในส่วนต่อไปนี้ กรุ. ทิศทางนั้นง่ายพอที่จะติดตามได้โดยไม่มีปัญหามากนัก
เมื่อ Generative Agents กลายเป็นสาขาที่น่าตื่นเต้น การวิจัยจำนวนมากจึงเกิดขึ้นจากสิ่งนี้ ในบทความนี้ เราจะสำรวจเอกสาร Generative Agents ต่างๆ ที่คุณควรอ่าน สิ่งเหล่านี้คืออะไร? เรามาเข้าเรื่องกันเถอะ
1. ตัวแทนการสื่อสารเพื่อการพัฒนาซอฟต์แวร์
พื้นที่ เอกสารตัวแทนการสื่อสารเพื่อการพัฒนาซอฟต์แวร์ (ควอน เอตอัล, 2023) คือแนวทางใหม่ในการปฏิวัติการพัฒนาซอฟต์แวร์โดยใช้ Generative Agents สมมติฐานที่นักวิจัยเสนอคือวิธีที่กระบวนการพัฒนาซอฟต์แวร์ทั้งหมดสามารถปรับปรุงและเป็นหนึ่งเดียวโดยใช้การสื่อสารภาษาธรรมชาติจาก Large Language Models (LLM) งานต่างๆ ได้แก่ การพัฒนาโค้ด การสร้างเอกสาร การวิเคราะห์ข้อกำหนด และอื่นๆ อีกมากมาย
นักวิจัยชี้ให้เห็นว่าการสร้างซอฟต์แวร์ทั้งหมดโดยใช้ LLM มีความท้าทายที่สำคัญสองประการ: ภาพหลอนและการขาดการตรวจสอบในการตัดสินใจ เพื่อแก้ไขปัญหาเหล่านี้ นักวิจัยเสนอกรอบการพัฒนาซอฟต์แวร์แบบแชทที่เรียกว่า ChatDev
เฟรมเวิร์ก ChatDev มีสี่ขั้นตอน: การออกแบบ การเขียนโค้ด การทดสอบ และการจัดทำเอกสาร ในแต่ละระยะ ChatDev จะสร้างเอเจนต์หลายตัวที่มีบทบาทต่างกัน เช่น ผู้ตรวจสอบโค้ด โปรแกรมเมอร์ซอฟต์แวร์ ฯลฯ เพื่อให้มั่นใจว่าการสื่อสารระหว่างเอเจนต์ดำเนินไปอย่างราบรื่น นักวิจัยได้พัฒนากลุ่มแชทที่แบ่งเฟสออกเป็นงานย่อยของอะตอมตามลำดับ งานย่อยแต่ละงานจะใช้การทำงานร่วมกันและการมีปฏิสัมพันธ์ระหว่างตัวแทน
กรอบงาน ChatDev แสดงอยู่ในภาพด้านล่าง
กรอบ ChatDev ที่เสนอ (Quan เอตอัล, 2023)
นักวิจัยทำการทดลองต่างๆ เพื่อวัดว่าเฟรมเวิร์ก ChatDev ทำงานอย่างไรในการพัฒนาซอฟต์แวร์ โดยใช้ gpt3.5-เทอร์โบ-16kด้านล่างคือประสิทธิภาพการทดสอบสถิติซอฟต์แวร์
สถิติซอฟต์แวร์กรอบงาน ChatDev (Quan เอตอัล, 2023)
ตัวเลขข้างต้นเป็นตัวชี้วัดในการวิเคราะห์ทางสถิติเกี่ยวกับระบบซอฟต์แวร์ที่สร้างโดย ChatDev ตัวอย่างเช่น มีการสร้างโค้ดอย่างน้อย 39 บรรทัด โดยสูงสุดคือ 359 บรรทัด นักวิจัยยังแสดงให้เห็นว่า 86.66% ของระบบซอฟต์แวร์ที่สร้างขึ้นทำงานได้อย่างถูกต้อง
เป็นรายงานที่ยอดเยี่ยมที่แสดงให้เห็นถึงศักยภาพในการเปลี่ยนแปลงวิธีการทำงานของนักพัฒนา อ่านบทความนี้เพิ่มเติมเพื่อทำความเข้าใจการใช้งาน ChatDev อย่างเต็มรูปแบบ รหัสเต็มยังมีอยู่ใน ChatDev กรุ.
2. AgentVerse: อำนวยความสะดวกในการทำงานร่วมกันของตัวแทนหลายรายและการสำรวจพฤติกรรมฉุกเฉินในตัวแทน
AgentVerse เป็นเฟรมเวิร์กที่เสนอในรายงานโดย เฉินและคณะ. 2023 เพื่อจำลองกลุ่มตัวแทนผ่านโมเดลภาษาขนาดใหญ่ไปจนถึงขั้นตอนการแก้ปัญหาแบบไดนามิกภายในกลุ่มและการปรับเปลี่ยนสมาชิกกลุ่มตามความก้าวหน้า การศึกษานี้มีขึ้นเพื่อแก้ปัญหาความท้าทายของพลวัตของกลุ่มคงที่ซึ่งตัวแทนอัตโนมัติไม่สามารถปรับตัวและพัฒนาในการแก้ปัญหาได้
เฟรมเวิร์ก AgentVerse พยายามแบ่งเฟรมเวิร์กออกเป็นสี่ขั้นตอน ได้แก่:
- การสรรหาผู้เชี่ยวชาญ: ขั้นตอนการปรับตัวแทนให้สอดคล้องกับปัญหาและแนวทางแก้ไข
- การตัดสินใจร่วมกัน: ตัวแทนหารือกันเพื่อกำหนดแนวทางแก้ไขและกลยุทธ์ในการแก้ปัญหา
- การดำเนินการดำเนินการ: ตัวแทนดำเนินการดำเนินการในสภาพแวดล้อมตามการตัดสินใจ
- การประเมินผล: มีการประเมินสภาพปัจจุบันและเป้าหมาย รางวัลคำติชมจะกลับไปยังขั้นตอนแรกหากยังคงต้องบรรลุเป้าหมาย
โครงสร้างโดยรวมของ AgentVerse แสดงอยู่ในรูปภาพด้านล่าง
กรอบงาน AgentVerse (เฉิน เอตอัล, 2023)
นักวิจัยทดลองกับเฟรมเวิร์กและเปรียบเทียบเฟรมเวิร์ก AgentVerse กับโซลูชันเอเจนต์แต่ละรายการ ผลลัพธ์จะแสดงในภาพด้านล่าง
การวิเคราะห์ประสิทธิภาพของ AgentVerse (Chen เอตอัล, 2023)
โดยทั่วไป เฟรมเวิร์ก AgentVerse สามารถทำงานได้ดีกว่าเอเจนต์แต่ละรายในงานที่นำเสนอทั้งหมด นี่เป็นการพิสูจน์ว่า generative agent สามารถทำงานได้ดีกว่าตัวแทนแต่ละรายที่พยายามแก้ไขปัญหา คุณสามารถลองใช้กรอบงานผ่านพวกเขาได้ กรุ.
3. AgentSims: แซนด์บ็อกซ์โอเพ่นซอร์สสำหรับการประเมินโมเดลภาษาขนาดใหญ่
การประเมินความสามารถของ LLM ยังคงเป็นคำถามเปิดในชุมชนและภาคสนาม ประเด็นสามประการที่จำกัดความสามารถในการประเมิน LLM อย่างเหมาะสมคือความสามารถในการประเมินที่จำกัดตามงาน เกณฑ์มาตรฐานที่มีช่องโหว่ และตัวชี้วัดที่ไม่เป็นรูปธรรม เพื่อจัดการกับปัญหาเหล่านี้ หลิน เอตอัล, 2023 เสนอการประเมินตามงานเป็นเกณฑ์มาตรฐาน LLM ในรายงานของพวกเขา แนวทางนี้หวังว่าจะกลายเป็นมาตรฐานในการประเมินงานของ LLM เนื่องจากสามารถบรรเทาปัญหาทั้งหมดที่เกิดขึ้นได้ เพื่อให้บรรลุเป้าหมายนี้ นักวิจัยได้แนะนำกรอบการทำงานที่เรียกว่า AgentSims
AgentSims เป็นโปรแกรมที่มีโครงสร้างพื้นฐานเชิงโต้ตอบและการแสดงภาพสำหรับดูแลงานการประเมินสำหรับ LLM วัตถุประสงค์โดยรวมของ AgentSims คือเพื่อให้นักวิจัยและผู้เชี่ยวชาญมีแพลตฟอร์มเพื่อปรับปรุงกระบวนการออกแบบงาน และใช้เป็นเครื่องมือในการประเมินผล ส่วนหน้าของ AgentSims แสดงอยู่ในภาพด้านล่าง
ส่วนหน้าของ AgentSims (Lin เอตอัล, 2023)
เนื่องจากเป้าหมายสำหรับ AgentSims คือทุกคนที่ต้องการการประเมิน LLM ด้วยวิธีที่ง่ายกว่า นักวิจัยจึงพัฒนาส่วนหน้าซึ่งเราสามารถโต้ตอบกับ UI ได้ คุณยังสามารถลองสาธิตแบบเต็มได้ เว็บไซต์ หรือเข้าถึงรหัสเต็มใน AgentSims กรุ.
Generative Agents เป็นแนวทางล่าสุดใน LLM เพื่อจำลองพฤติกรรมของมนุษย์ ผลการวิจัยล่าสุดโดยปาร์ค อัล et., ปี 2023 ได้แสดงให้เห็นความเป็นไปได้อย่างมากว่า Generative Agents จะทำอะไรได้บ้าง นั่นคือเหตุผลที่งานวิจัยหลายประเภทเกี่ยวกับ Generative Agents ได้ปรากฏตัวและเปิดประตูใหม่ๆ มากมาย
ในบทความนี้ เราได้พูดคุยเกี่ยวกับการวิจัย Generative Agents ที่แตกต่างกัน XNUMX ประการ ได้แก่:
- เอกสารตัวแทนการสื่อสารเพื่อการพัฒนาซอฟต์แวร์ (Quan เอตอัล, 2023)
- AgentVerse: อำนวยความสะดวกในการทำงานร่วมกันหลายตัวแทนและการสำรวจพฤติกรรมฉุกเฉินในตัวแทน (เฉินและคณะ. 2023)
3. AgentSims: แซนด์บ็อกซ์โอเพ่นซอร์สสำหรับการประเมินโมเดลภาษาขนาดใหญ่ (หลิน เอตอัล, 2023)
คอร์เนลเลียส ยุธา วิชายา เป็นผู้ช่วยผู้จัดการด้านวิทยาศาสตร์ข้อมูลและผู้เขียนข้อมูล ในขณะที่ทำงานเต็มเวลาที่ Allianz Indonesia เขาชอบแบ่งปันเคล็ดลับ Python และ Data ผ่านโซเชียลมีเดียและสื่อการเขียน
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- PlatoData.Network Vertical Generative Ai เพิ่มพลังให้กับตัวเอง เข้าถึงได้ที่นี่.
- เพลโตไอสตรีม. Web3 อัจฉริยะ ขยายความรู้ เข้าถึงได้ที่นี่.
- เพลโตESG. คาร์บอน, คลีนเทค, พลังงาน, สิ่งแวดล้อม แสงอาทิตย์, การจัดการของเสีย. เข้าถึงได้ที่นี่.
- เพลโตสุขภาพ เทคโนโลยีชีวภาพและข่าวกรองการทดลองทางคลินิก เข้าถึงได้ที่นี่.
- ที่มา: https://www.kdnuggets.com/generative-agent-research-papers-you-should-read?utm_source=rss&utm_medium=rss&utm_campaign=generative-agent-research-papers-you-should-read
- :มี
- :เป็น
- :ที่ไหน
- $ ขึ้น
- 2023
- 25
- 39
- a
- ความสามารถ
- ความสามารถ
- เกี่ยวกับเรา
- ข้างบน
- เข้า
- บรรลุ
- กระทำ
- การกระทำ
- การปฏิบัติ
- อยากทำกิจกรรม
- ปรับ
- ที่อยู่
- การปรับ
- ตัวแทน
- ตัวแทน
- AL
- จัดแนว
- ทั้งหมด
- บรรเทา
- อลิอันซ์
- ช่วยให้
- แล้ว
- ด้วย
- an
- การวิเคราะห์
- วิเคราะห์
- และ
- ใช้
- เข้าใกล้
- สถาปัตยกรรม
- เป็น
- บทความ
- AS
- ผู้ช่วย
- At
- อิสระ
- ใช้ได้
- ตาม
- BE
- กลายเป็น
- สมควร
- กำลัง
- ด้านล่าง
- มาตรฐาน
- มาตรฐาน
- ดีกว่า
- ระหว่าง
- by
- ที่เรียกว่า
- CAN
- ไม่ได้
- ความสามารถ
- โซ่
- ท้าทาย
- ความท้าทาย
- เปลี่ยนแปลง
- ChatGPT
- เฉิน
- รหัส
- รหัส
- การเข้ารหัส
- ประกาศเกียรติคุณ
- การทำงานร่วมกัน
- การทำงานร่วมกัน
- การสื่อสาร
- ชุมชน
- เมื่อเทียบกับ
- ส่วนประกอบ
- สภาพ
- งานที่เชื่อมต่อ
- การปรุงอาหาร
- ได้
- สร้าง
- การสร้าง
- curating
- ปัจจุบัน
- ข้อมูล
- วิทยาศาสตร์ข้อมูล
- วัน
- การตัดสินใจ
- การตัดสินใจ
- ทดลอง
- ออกแบบ
- กระบวนการออกแบบ
- การออกแบบ
- พัฒนา
- นักพัฒนา
- นักพัฒนาทำงาน
- ที่กำลังพัฒนา
- พัฒนาการ
- ต่าง
- ทิศทาง
- สนทนา
- แบ่งออก
- do
- การจัดทำเอกสาร
- เอกสาร
- ประตู
- พลวัต
- พลศาสตร์
- E&T
- แต่ละ
- ง่ายดาย
- การเปิดใช้งาน
- ปลาย
- พอ
- ทำให้มั่นใจ
- ทั้งหมด
- สิ่งแวดล้อม
- โดยเฉพาะอย่างยิ่ง
- สร้าง
- ฯลฯ
- ประเมินค่า
- ประเมิน
- การประเมินการ
- การประเมินผล
- ทุกคน
- คาย
- ตัวอย่าง
- น่าตื่นเต้น
- ดำเนินการ
- การปฏิบัติ
- ที่มีอยู่
- ประสบการณ์
- ประสบการณ์
- การทดลอง
- การทดลอง
- ชำนาญ
- ผู้เชี่ยวชาญ
- อธิบาย
- สำรวจ
- สำรวจ
- อำนวยความสะดวก
- ข้อเสนอแนะ
- สนาม
- สาขา
- หา
- ชื่อจริง
- โฟกัส
- ปฏิบัติตาม
- ดังต่อไปนี้
- ดังต่อไปนี้
- สำหรับ
- สี่
- กรอบ
- ราคาเริ่มต้นที่
- ด้านหน้า
- ปลายด้านหน้า
- เต็ม
- ต่อไป
- อนาคต
- เกม
- โดยทั่วไป
- สร้าง
- สร้าง
- การสร้าง
- กำเนิด
- แบบจำลองการกำเนิด
- ได้รับ
- เป้าหมาย
- เป้าหมาย
- ยิ่งใหญ่
- บัญชีกลุ่ม
- กลุ่ม
- จัดการ
- สิ่งที่เกิดขึ้น
- การควบคุม
- มี
- he
- ระดับสูง
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- HTTPS
- เป็นมนุษย์
- มนุษย์
- if
- ภาพ
- การดำเนินการ
- การดำเนินงาน
- การดำเนินการ
- in
- ประกอบด้วย
- รวมทั้ง
- เป็นรายบุคคล
- อินโดนีเซีย
- มีอิทธิพล
- โครงสร้างพื้นฐาน
- ความเข้าใจ
- แรงบันดาลใจ
- โต้ตอบ
- ปฏิสัมพันธ์
- ปฏิสัมพันธ์
- การโต้ตอบ
- เข้าไป
- แนะนำ
- IT
- jpg
- KD นักเก็ต
- ไม่มี
- ภาษา
- ใหญ่
- ล่าสุด
- เรียนรู้
- กดไลก์
- LIMIT
- ถูก จำกัด
- lin
- เส้น
- รัก
- ทำ
- สำคัญ
- ทำ
- ผู้จัดการ
- หลาย
- สูงสุด
- วัด
- ภาพบรรยากาศ
- สมาชิก
- ความทรงจำ
- หน่วยความจำ
- ครึ่ง
- เมตริก
- ตัวชี้วัด
- ขั้นต่ำ
- แบบ
- โมเดล
- ข้อมูลเพิ่มเติม
- มาก
- โดยธรรมชาติ
- ภาษาธรรมชาติ
- ความต้องการ
- ใหม่
- จำนวน
- วัตถุประสงค์
- of
- on
- เปิด
- โอเพนซอร์ส
- เปิด
- or
- อื่นๆ
- ออก
- แนะ
- ทั้งหมด
- กระดาษ
- เอกสาร
- สวนสาธารณะ
- รูปแบบไฟล์ PDF
- ดำเนินการ
- การปฏิบัติ
- ดำเนินการ
- ระยะ
- แผนการ
- แผน
- เวที
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- จุด
- จุด
- ความเป็นไปได้
- ที่มีศักยภาพ
- นำเสนอ
- ก่อน
- ปัญหา
- การแก้ปัญหา
- ปัญหาที่เกิดขึ้น
- ขั้นตอน
- กระบวนการ
- โครงการ
- โปรแกรมเมอร์
- ในอาชีพ
- อย่างถูกต้อง
- เสนอ
- เสนอ
- พิสูจน์
- ให้
- หลาม
- คำถาม
- ยก
- เกิดปฏิกิริยา
- อ่าน
- เมื่อเร็ว ๆ นี้
- บันทึก
- การสรรหาบุคลากร
- สะท้อน
- เกี่ยวกับ
- ตรงประเด็น
- ความต้องการ
- ต้อง
- การวิจัย
- นักวิจัย
- นักวิจัย
- ผล
- กลับ
- ปฏิวัติ
- รางวัล
- บทบาท
- ทำงาน
- s
- Sandbox
- วิทยาศาสตร์
- หลาย
- Share
- น่า
- โชว์
- แสดงให้เห็นว่า
- แสดง
- แสดงให้เห็นว่า
- ง่าย
- เดอะซิมส์
- อย่างราบรื่น
- สังคม
- โซเชียลมีเดีย
- สังคม
- ซอฟต์แวร์
- การพัฒนาซอฟต์แวร์
- ทางออก
- แก้
- การแก้
- การพูด
- แยก
- มาตรฐาน
- Stanford
- มหาวิทยาลัยสแตนฟอร์ด
- ทางสถิติ
- สถิติ
- ขั้นตอน
- ขั้นตอน
- ยังคง
- จัดเก็บ
- กลยุทธ์
- กระแส
- เพรียวลม
- คล่องตัว
- โครงสร้าง
- ศึกษา
- ประสบความสำเร็จ
- ระบบ
- ระบบ
- เป้า
- งาน
- งาน
- ระยะ
- การทดสอบ
- กว่า
- ที่
- พื้นที่
- แซนด์บ็อกซ์
- ของพวกเขา
- พวกเขา
- ตัวเอง
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- พวกเขา
- นี้
- สาม
- ตลอด
- ตลอด
- เคล็ดลับ
- ไปยัง
- เครื่องมือ
- ลอง
- พยายาม
- สอง
- ชนิด
- ui
- เข้าใจ
- ปึกแผ่น
- มหาวิทยาลัย
- ใช้
- การใช้
- ต่างๆ
- ผ่านทาง
- การสร้างภาพ
- การออกเสียง
- อ่อนแอ
- วิธี
- we
- อะไร
- ที่
- ในขณะที่
- WHO
- ทั้งหมด
- ทำไม
- จะ
- กับ
- ภายใน
- ไม่มี
- งาน
- ทำงาน
- การทำงาน
- โรงงาน
- จะ
- นักเขียน
- การเขียน
- เธอ
- ลมทะเล