الأوراق البحثية للوكيل التوليدي التي يجب عليك قراءتها - KDnuggets

أعاد نشره أفلاطون

المتابعون: 0

الأوراق البحثية للوكيل التوليدي التي يجب عليك قراءتها
الصورة عن طريق com.pikisuperstar on Freepik

الوكلاء المولدون هو مصطلح صاغته جامعة ستانفورد وباحثو جوجل في ورقتهم البحثية التي تسمى الوكلاء المولدون: محاكاة تفاعلية للسلوك البشري (حديقة وآخرون، 2023). في هذه الورقة، يشرح البحث أن الوكلاء التوليديين عبارة عن برامج حسابية تحاكي السلوك البشري بشكل معقول.

في هذه الورقة، يقدمون كيف يمكن للوكلاء أن يتصرفوا مثل ما سيفعله البشر: الكتابة، والطبخ، والتحدث، والتصويت، والنوم، وما إلى ذلك، من خلال تنفيذ نموذج توليدي، وخاصة نموذج اللغة الكبير (LLM). يمكن للوكلاء إظهار القدرة على عمل استنتاجات حول أنفسهم، والوكلاء الآخرين، وبيئتهم من خلال تسخير نموذج اللغة الطبيعية.

يقوم الباحث ببناء بنية نظام لتخزين وتوليف وتطبيق الذكريات ذات الصلة لتوليد سلوك معقول باستخدام نموذج لغة كبير، مما يتيح للوكلاء المولدين. ويتكون هذا النظام من ثلاثة عناصر، هي:

تيار الذاكرة. يسجل النظام تجارب الوكيل ويعتبر مرجعًا لتصرفات الوكيل المستقبلية.
انعكاس. يقوم النظام بتجميع التجربة في ذكريات ليتمكن الوكيل من التعلم والأداء بشكل أفضل.
تخطيط الرحلة. يقوم النظام بترجمة الرؤية من النظام السابق إلى خطط عمل عالية المستوى ويسمح للوكيل بالتفاعل مع البيئة.

تعمل هذه الانعكاسات وأنظمة التخطيط بشكل تآزري مع تدفق الذاكرة للتأثير على سلوك العميل المستقبلي.

لمحاكاة النظام أعلاه، يركز الباحثون على إنشاء مجتمع تفاعلي من العملاء مستوحى من لعبة Sims. ترتبط البنية المذكورة أعلاه بـ ChatGPT وتظهر بنجاح 25 تفاعلًا للوكيل داخل صندوق الحماية الخاص بهم. يظهر في الصورة أدناه مثال على نشاط الوكيل على مدار اليوم.

الأوراق البحثية للوكيل التوليدي التي يجب عليك قراءتها
نشاط الوكيل التوليدي وتفاعله طوال اليوم (Park وآخرون. ، 2023)

الكود الكامل لإنشاء الوكلاء التوليديين ومحاكاتهم في وضع الحماية أصبح بالفعل مفتوح المصدر من قبل الباحثين، والذي يمكنك العثور عليه في ما يلي مستودع. الاتجاه بسيط بما فيه الكفاية بحيث يمكنك متابعته دون مشكلة كبيرة.

مع تحول الوكلاء المولدين إلى مجال مثير، يتم إجراء الكثير من الأبحاث بناءً على هذا. في هذه المقالة، سوف نستكشف العديد من الأوراق البحثية الخاصة بالوكلاء المولدين والتي يجب عليك قراءتها. ما هي هذه؟ دعونا ندخل في ذلك.

1. وكلاء التواصل لتطوير البرمجيات

• وكلاء الاتصالات لورقة تطوير البرمجيات (كوان وآخرون.، 2023) هو نهج جديد لإحداث ثورة في تطوير البرمجيات باستخدام الوكلاء التوليديين. الفرضية التي يقترحها الباحثون هي كيف يمكن تبسيط عملية تطوير البرمجيات بأكملها وتوحيدها باستخدام التواصل باللغة الطبيعية من نماذج اللغات الكبيرة (LLM). تشمل المهام تطوير التعليمات البرمجية وإنشاء المستندات وتحليل المتطلبات وغير ذلك الكثير.

ويشير الباحثون إلى أن إنشاء برنامج كامل باستخدام LLM يواجه تحديين رئيسيين: الهلوسة وعدم الاستجواب في عملية صنع القرار. ولمعالجة هذه المشكلات، يقترح الباحثون إطارًا لتطوير البرمجيات قائمًا على الدردشة يسمى ChatDev.

يتبع إطار عمل ChatDev أربع مراحل: التصميم والترميز والاختبار والتوثيق. في كل مرحلة، يقوم ChatDev بإنشاء عدة وكلاء بأدوار مختلفة، على سبيل المثال، مراجعي التعليمات البرمجية، ومبرمجي البرمجيات، وما إلى ذلك. ولضمان سير الاتصال بين الوكلاء بسلاسة، طور الباحثون سلسلة دردشة تقسم المراحل إلى مهام فرعية ذرية متسلسلة. ستقوم كل مهمة فرعية بتنفيذ التعاون والتفاعل بين الوكلاء.

يظهر إطار عمل ChatDev في الصورة أدناه.

الأوراق البحثية للوكيل التوليدي التي يجب عليك قراءتها
إطار عمل ChatDev المقترح (Quan وآخرون.، 2023)

يقوم الباحثون بإجراء تجارب مختلفة لقياس كيفية أداء إطار عمل ChatDev في تطوير البرمجيات. باستخدام gpt3.5-توربو-16كأدناه هو أداء تجربة إحصاءات البرمجيات.

الأوراق البحثية للوكيل التوليدي التي يجب عليك قراءتها
إحصائيات برامج إطار عمل ChatDev (Quan وآخرون.، 2023)

الرقم أعلاه هو مقياس للتحليل الإحصائي فيما يتعلق بأنظمة البرامج التي تم إنشاؤها بواسطة ChatDev. على سبيل المثال، يتم إنشاء 39 سطرًا من التعليمات البرمجية كحد أدنى، والحد الأقصى هو 359 رمزًا. وأظهر الباحثون أيضًا أن 86.66% من الأنظمة البرمجية التي تم إنشاؤها تعمل بشكل صحيح.

إنها ورقة بحثية رائعة تُظهر إمكانية تغيير طريقة عمل المطورين. اقرأ الورقة بشكل أكبر لفهم التنفيذ الكامل لـ ChatDev. الكود الكامل متاح أيضًا في ChatDev مستودع.

2. AgentVerse: تسهيل التعاون بين الوكلاء المتعددين واستكشاف السلوكيات الناشئة لدى الوكلاء

AgentVerse هو إطار مقترح في الورقة بواسطة تشن وآخرون.، 2023 لمحاكاة مجموعات الوكلاء عبر نموذج اللغة الكبير لإجراءات حل المشكلات الديناميكية داخل المجموعة وتعديل أعضاء المجموعة بناءً على التقدم. توجد هذه الدراسة لحل التحدي المتمثل في ديناميكيات المجموعة الثابتة حيث لا يستطيع الوكيل المستقل التكيف والتطور في حل المشكلات.

يحاول إطار عمل AgentVerse تقسيم إطار العمل إلى أربع خطوات، بما في ذلك:

توظيف الخبراء: مرحلة التكيف للوكلاء للتوافق مع المشكلة والحل
صنع القرار التعاوني: يناقش الوكلاء صياغة حل واستراتيجية لحل المشكلة.
تنفيذ الإجراء: يقوم الوكلاء بتنفيذ الإجراء في البيئة بناءً على القرار.
التقييم: يتم تقييم الوضع الحالي والأهداف. ستعود مكافأة التعليقات إلى الخطوة الأولى إذا كان الهدف لا يزال بحاجة إلى تحقيقه.

يظهر الهيكل العام لـ AgentVerse في الصورة أدناه.

الأوراق البحثية للوكيل التوليدي التي يجب عليك قراءتها
إطار عمل AgentVerse (Chen وآخرون.، 2023)

جرب الباحثون إطار العمل وقارنوا إطار عمل AgentVerse بحل الوكيل الفردي. يتم عرض النتيجة في الصورة أدناه.

الأوراق البحثية للوكيل التوليدي التي يجب عليك قراءتها
تحليل أداء AgentVerse (Chen وآخرون.، 2023)

يمكن لإطار عمل AgentVerse أن يتفوق بشكل عام على الوكلاء الفرديين في جميع المهام المقدمة. وهذا يثبت أن الوكلاء التوليديين يمكنهم أداء أفضل من الوكلاء الفرديين الذين يحاولون حل المشكلات. يمكنك تجربة الإطار من خلالهم مستودع.

3. AgentSims: صندوق رمل مفتوح المصدر لتقييم نماذج اللغات الكبيرة

لا يزال تقييم قدرة LLMs سؤالاً مفتوحًا داخل المجتمع والمجالات. ثلاث نقاط تحد من القدرة على تقييم LLM بشكل صحيح هي قدرات التقييم المحدودة حسب المهام، والمعايير الضعيفة، والمقاييس غير الموضوعية. للتعامل مع هذه المشاكل، لين وآخرون.، 2023 اقترح تقييمًا قائمًا على المهام كمعيار LLM في ورقتهم. من المأمول أن يصبح هذا النهج معيارًا في تقييم أعمال LLM لأنه يمكن أن يخفف من جميع المشكلات المثارة. ولتحقيق ذلك، قدم الباحثون إطارًا يسمى AgentSims.

AgentSims هو برنامج ذو بنية تحتية تفاعلية وتصورية لتنظيم مهام التقييم لـ LLMs. الهدف العام لـ AgentSims هو تزويد الباحثين والخبراء بمنصة لتبسيط عملية تصميم المهام واستخدامها كأداة تقييم. يتم عرض الواجهة الأمامية لـ AgentSims في الصورة أدناه.

الأوراق البحثية للوكيل التوليدي التي يجب عليك قراءتها
الواجهة الأمامية لـ AgentSims (Lin وآخرون.، 2023)

نظرًا لأن هدف AgentSims هو كل من يحتاج إلى تقييم LLM بطرق أسهل، فقد طور الباحثون الواجهة الأمامية حيث يمكننا التفاعل مع واجهة المستخدم. يمكنك أيضًا تجربة العرض التوضيحي الكامل على موقع الكتروني أو الوصول إلى الرمز الكامل في AgentSims مستودع.

الوكلاء المولدون هم نهج حديث في LLMs لمحاكاة السلوكيات البشرية. أحدث الأبحاث التي أجراها بارك وآخرون، لقد أظهر عام 2023 إمكانية كبيرة لما يمكن أن يفعله الوكلاء المولدون. ولهذا السبب ظهرت العديد من أنواع الأبحاث المعتمدة على الوكلاء المولدين وفتحت العديد من الأبواب الجديدة.

تحدثنا في هذه المقالة عن ثلاثة أبحاث مختلفة عن العوامل المولدة، بما في ذلك:

وكلاء الاتصالات لورقة تطوير البرمجيات (تشيوان وآخرون.، 2023)
AgentVerse: تسهيل التعاون بين الوكلاء المتعددين واستكشاف السلوكيات الناشئة لدى الوكلاء (تشن وآخرون.، 2023)

3. AgentSims: صندوق رمل مفتوح المصدر لتقييم نماذج اللغات الكبيرة (لين وآخرون.، 2023)

كورنليوس يودا ويجايا هو مدير مساعد لعلوم البيانات وكاتب بيانات. أثناء عمله بدوام كامل في Allianz Indonesia ، يحب مشاركة نصائح حول Python و Data عبر وسائل التواصل الاجتماعي وكتابة الوسائط.

الطابع الزمني: فبراير 10، 2023

ما هو الضجيج؟

الكتلة المصدر:

KD nuggets

عقدة المصدر: 1055899

الطابع الزمني: أغسطس 25، 2021

أهم المشاركات 2-8 يناير: أوراق الغش في Python Matplotlib

الكتلة المصدر:

KD nuggets

عقدة المصدر: 1897393

الطابع الزمني: يناير 12، 2023

يتفق القادة في Allstate و eBay و Red Bull: لا تفوت قمة Rev 3 Enterprise MLOps

الكتلة المصدر:

KD nuggets

عقدة المصدر: 1039259

الطابع الزمني: أغسطس 17، 2021

أعاد نشره أفلاطون

دليل الأبله لمصفوفة الدقة والاستدعاء والارتباك

KDnuggets News ، 14 يونيو: GPT4 - كل محادثتك المحلية المجانية GPT! • Falcon LLM: ملك المصدر المفتوح - KDnuggets

استكشاف قوة وحدود GPT-4 - KDnuggets

أهم المشاركات 2-8 يناير: أوراق الغش في Python Matplotlib

يتفق القادة في Allstate و eBay و Red Bull: لا تفوت قمة Rev 3 Enterprise MLOps

من نحن

البحث العمودي و Ai

الانطلاق

ابق على تواصل

حسابي

1. وكلاء التواصل لتطوير البرمجيات

2. AgentVerse: تسهيل التعاون بين الوكلاء المتعددين واستكشاف السلوكيات الناشئة لدى الوكلاء

3. AgentSims: صندوق رمل مفتوح المصدر لتقييم نماذج اللغات الكبيرة

المزيد عن هذا الموضوع

اكثر من KD nuggets

من نحن

البحث العمودي و Ai

الانطلاق

ابق على تواصل

حسابي