Ερευνητικές εργασίες Generative Agent που πρέπει να διαβάσετε - KDnuggets

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Ερευνητικές εργασίες Generative Agent που πρέπει να διαβάσετε
Εικόνα από pikisuperstar on Freepik

Το Generative Agents είναι ένας όρος που επινοήθηκε από το Πανεπιστήμιο του Στάνφορντ και τους ερευνητές της Google στην εργασία τους που ονομάζεται Generative Agents: Interactive Simulacra of Human Behavior (Πάρκο et αϊ., 2023). Σε αυτό το άρθρο, η έρευνα εξηγεί ότι οι Generative Agents είναι υπολογιστικό λογισμικό που προσομοιώνει πιστευτά την ανθρώπινη συμπεριφορά.

Στην εργασία, παρουσιάζουν πώς οι πράκτορες θα μπορούσαν να ενεργήσουν όπως θα έκαναν οι άνθρωποι: γράψιμο, μαγείρεμα, ομιλία, ψηφοφορία, ύπνος κ.λπ., εφαρμόζοντας ένα παραγωγικό μοντέλο, ειδικά το Μεγάλο Γλωσσικό Μοντέλο (LLM). Οι πράκτορες μπορούν να δείξουν την ικανότητα να κάνουν συμπεράσματα για τους εαυτούς τους, τους άλλους πράκτορες και το περιβάλλον τους αξιοποιώντας το μοντέλο της φυσικής γλώσσας.

Ο ερευνητής κατασκευάζει μια αρχιτεκτονική συστήματος για να αποθηκεύει, να συνθέτει και να εφαρμόζει σχετικές μνήμες για να δημιουργήσει αξιόπιστη συμπεριφορά χρησιμοποιώντας ένα μεγάλο γλωσσικό μοντέλο, επιτρέποντας τους παραγωγούς. Αυτό το σύστημα αποτελείται από τρία στοιχεία, τα οποία είναι:

Ροή μνήμης. Το σύστημα καταγράφει τις εμπειρίες του πράκτορα και αποτελεί αναφορά για τις μελλοντικές ενέργειες του πράκτορα.
Αναστοχασμός. Το σύστημα συνθέτει την εμπειρία σε αναμνήσεις για να μάθει ένας πράκτορας και να αποδώσει καλύτερα.
Σχεδιασμός. Το σύστημα μεταφράζει τη γνώση από το προηγούμενο σύστημα σε σχέδια δράσης υψηλού επιπέδου και επιτρέπει στον πράκτορα να αντιδρά στο περιβάλλον.

Αυτές οι ανακλάσεις και τα συστήματα σχεδίου λειτουργούν συνεργιστικά με τη ροή μνήμης για να επηρεάσουν τη μελλοντική συμπεριφορά του πράκτορα.

Για να προσομοιώσουν το παραπάνω σύστημα, οι ερευνητές επικεντρώνονται στη δημιουργία μιας διαδραστικής κοινωνίας πρακτόρων εμπνευσμένη από το παιχνίδι Sims. Η παραπάνω αρχιτεκτονική συνδέεται με το ChatGPT και εμφανίζει με επιτυχία 25 αλληλεπιδράσεις πρακτόρων μέσα στο sandbox τους. Ένα παράδειγμα δραστηριότητας αντιπροσώπου κατά τη διάρκεια της ημέρας φαίνεται στην παρακάτω εικόνα.

Ερευνητικές εργασίες Generative Agent που πρέπει να διαβάσετε
Δραστηριότητα και αλληλεπίδραση Generative Agent καθ' όλη τη διάρκεια της ημέρας (Park et αϊ., 2023)

Ολόκληρος ο κώδικας για τη δημιουργία Generative Agents και την προσομοίωση τους στο sandbox είναι ήδη ανοιχτός κώδικας από τους ερευνητές, τον οποίο μπορείτε να βρείτε παρακάτω Αποθήκη. Η κατεύθυνση είναι αρκετά απλή που μπορείτε να τις ακολουθήσετε χωρίς ιδιαίτερο πρόβλημα.

Με τους Generative Agents να γίνονται ένα συναρπαστικό πεδίο, πολλές έρευνες γίνονται με βάση αυτό. Σε αυτό το άρθρο, θα εξερευνήσουμε διάφορα έγγραφα του Generative Agents που πρέπει να διαβάσετε. Τι είναι αυτά? Ας μπούμε σε αυτό.

1. Επικοινωνιακοί Πράκτορες για Ανάπτυξη Λογισμικού

Η Έγγραφο Communicative Agents for Software Development (Quan et αϊ., 2023) είναι μια νέα προσέγγιση για την επανάσταση στην ανάπτυξη λογισμικού χρησιμοποιώντας τους Generative Agents. Η υπόθεση που προτείνουν οι ερευνητές είναι ο τρόπος με τον οποίο ολόκληρη η διαδικασία ανάπτυξης λογισμικού θα μπορούσε να εξορθολογιστεί και να ενοποιηθεί χρησιμοποιώντας επικοινωνία φυσικής γλώσσας από τα μεγάλα γλωσσικά μοντέλα (LLM). Οι εργασίες περιλαμβάνουν την ανάπτυξη κώδικα, τη δημιουργία εγγράφων, την ανάλυση των απαιτήσεων και πολλά άλλα.

Οι ερευνητές επισημαίνουν ότι η δημιουργία ενός ολόκληρου λογισμικού χρησιμοποιώντας το LLM έχει δύο μεγάλες προκλήσεις: την ψευδαίσθηση και την έλλειψη αλληλοεξέτασης στη λήψη αποφάσεων. Για την αντιμετώπιση αυτών των προβλημάτων, οι ερευνητές προτείνουν ένα πλαίσιο ανάπτυξης λογισμικού που βασίζεται σε συνομιλία που ονομάζεται ChatDev.

Το πλαίσιο ChatDev ακολουθεί τέσσερις φάσεις: σχεδιασμός, κωδικοποίηση, δοκιμή και τεκμηρίωση. Σε κάθε φάση, το ChatDev θα δημιουργούσε αρκετούς πράκτορες με διάφορους ρόλους, για παράδειγμα, αναθεωρητές κώδικα, προγραμματιστές λογισμικού, κ.λπ. Για να διασφαλιστεί η ομαλή εκτέλεση της επικοινωνίας μεταξύ των πρακτόρων, οι ερευνητές ανέπτυξαν μια αλυσίδα συνομιλίας που χώριζε τις φάσεις σε διαδοχικές ατομικές υποεργασίες. Κάθε δευτερεύουσα εργασία θα υλοποιούσε τη συνεργασία και την αλληλεπίδραση μεταξύ των πρακτόρων.

Το πλαίσιο ChatDev φαίνεται στην παρακάτω εικόνα.

Ερευνητικές εργασίες Generative Agent που πρέπει να διαβάσετε
Το προτεινόμενο πλαίσιο ChatDev (Quan et αϊ., 2023)

Οι ερευνητές πραγματοποιούν διάφορα πειράματα για να μετρήσουν την απόδοση του πλαισίου ChatDev στην ανάπτυξη λογισμικού. Με τη χρήση gpt3.5-turbo-16k, παρακάτω είναι η απόδοση του πειράματος στατιστικών λογισμικού.

Ερευνητικές εργασίες Generative Agent που πρέπει να διαβάσετε
Τα στατιστικά στοιχεία λογισμικού πλαισίου ChatDev (Quan et αϊ., 2023)

Ο παραπάνω αριθμός είναι μια μέτρηση για στατιστική ανάλυση σχετικά με τα συστήματα λογισμικού που δημιουργούνται από το ChatDev. Για παράδειγμα, δημιουργούνται τουλάχιστον 39 γραμμές κώδικα, με το μέγιστο να είναι 359 κωδικοί. Οι ερευνητές έδειξαν επίσης ότι το 86.66% των συστημάτων λογισμικού που δημιουργήθηκαν λειτουργούσαν σωστά.

Είναι ένα εξαιρετικό χαρτί που δείχνει τη δυνατότητα αλλαγής του τρόπου με τον οποίο λειτουργούν οι προγραμματιστές. Διαβάστε το άρθρο περαιτέρω για να κατανοήσετε την πλήρη εφαρμογή του ChatDev. Ο πλήρης κωδικός είναι επίσης διαθέσιμος στο ChatDev Αποθήκη.

2. AgentVerse: Διευκόλυνση της συνεργασίας πολλών πρακτόρων και εξερεύνηση έκτακτων συμπεριφορών σε πράκτορες

Το AgentVerse είναι ένα πλαίσιο που προτείνεται στο έγγραφο από Οι Chen et al., 2023 για την προσομοίωση των ομάδων πρακτόρων μέσω του Μεγάλου Γλωσσικού Μοντέλου σε διαδικασίες δυναμικής επίλυσης προβλημάτων εντός της ομάδας και προσαρμογής των μελών της ομάδας με βάση την πρόοδο. Αυτή η μελέτη υπάρχει για να λύσει την πρόκληση της δυναμικής στατικής ομάδας όπου ο αυτόνομος παράγοντας δεν μπορεί να προσαρμοστεί και να εξελιχθεί στην επίλυση προβλημάτων.

Το πλαίσιο AgentVerse προσπαθεί να χωρίσει το πλαίσιο σε τέσσερα βήματα, όπως:

Πρόσληψη ειδικών: Η φάση προσαρμογής για τους πράκτορες ώστε να ευθυγραμμιστούν με το πρόβλημα και τη λύση
Συνεργατική Λήψη Αποφάσεων: Οι πράκτορες συζητούν για να διαμορφώσουν μια λύση και στρατηγική για την επίλυση του προβλήματος.
Εκτέλεση Ενέργειας: Οι πράκτορες εκτελούν δράση στο περιβάλλον με βάση την απόφαση.
Αξιολόγηση: Αξιολογούνται η τρέχουσα κατάσταση και οι στόχοι. Η ανταμοιβή ανατροφοδότησης θα επιστρέψει στο πρώτο βήμα εάν ο στόχος εξακολουθεί να χρειάζεται να επιτευχθεί.

Η συνολική δομή του AgentVerse φαίνεται στην παρακάτω εικόνα.

Ερευνητικές εργασίες Generative Agent που πρέπει να διαβάσετε
Πλαίσιο AgentVerse (Chen et αϊ., 2023)

Οι ερευνητές πειραματίστηκαν με το πλαίσιο και συνέκριναν το πλαίσιο AgentVerse με τη λύση μεμονωμένου παράγοντα. Το αποτέλεσμα παρουσιάζεται στην παρακάτω εικόνα.

Ερευνητικές εργασίες Generative Agent που πρέπει να διαβάσετε
Ανάλυση απόδοσης του AgentVerse (Chen et αϊ., 2023)

Το πλαίσιο AgentVerse μπορεί γενικά να έχει καλύτερη απόδοση από μεμονωμένους πράκτορες σε όλες τις εργασίες που παρουσιάζονται. Αυτό αποδεικνύει ότι οι παραγωγοί πράκτορες θα μπορούσαν να έχουν καλύτερη απόδοση από τους μεμονωμένους πράκτορες που προσπαθούν να λύσουν προβλήματα. Θα μπορούσατε να δοκιμάσετε το πλαίσιο μέσω αυτών Αποθήκη.

3. AgentSims: An Open-Source Sandbox for Large Language Model Evaluation

Η αξιολόγηση της ικανότητας των LLMs εξακολουθεί να είναι ένα ανοιχτό ερώτημα εντός της κοινότητας και των τομέων. Τρία σημεία που περιορίζουν την ικανότητα σωστής αξιολόγησης του LLM είναι οι περιορισμένες ικανότητες αξιολόγησης από τις εργασίες, τα ευάλωτα σημεία αναφοράς και οι μη αντικειμενικές μετρήσεις. Για να χειριστείτε αυτά τα προβλήματα, Lin et αϊ., 2023 πρότειναν μια αξιολόγηση βάσει εργασιών ως σημείο αναφοράς LLM στο έγγραφό τους. Αυτή η προσέγγιση ήλπιζε να γίνει πρότυπο στην αξιολόγηση των εργασιών του LLM, καθώς θα μπορούσε να μετριάσει όλα τα προβλήματα που τέθηκαν. Για να επιτευχθεί αυτό, οι ερευνητές εισάγουν ένα πλαίσιο που ονομάζεται AgentSims.

Το AgentSims είναι ένα πρόγραμμα με διαδραστική υποδομή και οπτικοποίηση για την επιμέλεια εργασιών αξιολόγησης για LLMs. Ο γενικός στόχος του AgentSims είναι να παρέχει σε ερευνητές και εμπειρογνώμονες μια πλατφόρμα για τον εξορθολογισμό της διαδικασίας σχεδιασμού εργασιών και τη χρήση τους ως εργαλείο αξιολόγησης. Το μπροστινό μέρος του AgentSims παρουσιάζεται στην παρακάτω εικόνα.

Ερευνητικές εργασίες Generative Agent που πρέπει να διαβάσετε
AgentSims Front End (Lin et αϊ., 2023)

Καθώς ο στόχος για το AgentSims είναι όλοι όσοι χρειάζονται αξιολόγηση LLM με ευκολότερους τρόπους, οι ερευνητές ανέπτυξαν το μπροστινό μέρος όπου μπορούμε να αλληλεπιδράσουμε με τη διεπαφή χρήστη. Μπορείτε επίσης να δοκιμάσετε το πλήρες demo στο δικό τους ή αποκτήστε πρόσβαση στον πλήρη κωδικό στο AgentSims Αποθήκη.

Οι Generative Agents είναι μια πρόσφατη προσέγγιση στα LLM για την προσομοίωση ανθρώπινων συμπεριφορών. Η τελευταία έρευνα του Park et αϊ., το 2023 έχει δείξει μια μεγάλη πιθανότητα για το τι θα μπορούσαν να κάνουν οι Generative Agents. Αυτός είναι ο λόγος για τον οποίο πολλοί τύποι έρευνας που βασίζονται σε Generative Agents εμφανίστηκαν και άνοιξαν πολλές νέες πόρτες.

Σε αυτό το άρθρο, έχουμε μιλήσει για τρεις διαφορετικές έρευνες γενετικών παραγόντων, όπως:

Έγγραφο Communicative Agents for Software Development (Quan et αϊ., 2023)
AgentVerse: Διευκόλυνση της συνεργασίας πολλών πρακτόρων και εξερεύνηση έκτακτων συμπεριφορών σε πράκτορες (Οι Chen et al., 2023)

3. AgentSims: An Open-Source Sandbox for Large Language Model Evaluation (Lin et αϊ., 2023)

Cornellius Yudha Wijaya είναι βοηθός διευθυντής επιστήμης δεδομένων και συγγραφέας δεδομένων. Ενώ εργάζεται με πλήρη απασχόληση στην Allianz Indonesia, του αρέσει να μοιράζεται συμβουλές για Python και Data μέσω των μέσων κοινωνικής δικτύωσης και των μέσων συγγραφής.