読むべき生成エージェントの研究論文 - KDnuggets

読むべき生成エージェントの研究論文 – KDnuggets

ソースノード: 2903173

読むべき生成エージェントの研究論文
による画像 ピキスーパースター on Freepik
 

ジェネレーティブ エージェントとは、スタンフォード大学と Google の研究者が論文で作った造語です。 生成エージェント: 人間の行動のインタラクティブなシミュレーション (公園., 2023)。 この論文では、生成エージェントは人間の行動を確実にシミュレートする計算ソフトウェアであると研究が説明しています。 

この論文では、生成モデル、特に大規模言語モデル (LLM) を実装することによって、エージェントがどのように人間と同じように行動できるか (書く、料理する、話す、投票する、寝るなど) ことができることを紹介しています。 エージェントは、自然言語モデルを利用することで、自分自身、他のエージェント、および環境について推論する機能を示すことができます。

研究者は、大規模な言語モデルを使用して信頼できる動作を生成するために、関連する記憶を保存、合成、および適用するシステム アーキテクチャを構築し、生成エージェントを有効にします。 このシステムは XNUMX つのコンポーネントで構成されており、次のとおりです。

  1. メモリストリーム。 このシステムはエージェントの経験を記録し、エージェントの今後の行動の参考となります。
  2. 反射。 システムは、エージェントが学習し、より良いパフォーマンスを発揮できるように、経験を記憶に合成します。
  3. 計画。 このシステムは、以前のシステムからの洞察を高レベルのアクション プランに変換し、エージェントが環境に反応できるようにします。 

これらの反映および計画システムはメモリ ストリームと相乗的に機能し、エージェントの将来の動作に影響を与えます。 

上記のシステムをシミュレートするために、研究者らは、シムズ ゲームからインスピレーションを得たエージェントのインタラクティブな社会の構築に焦点を当てました。 上記のアーキテクチャは ChatGPT に接続されており、サンドボックス内での 25 のエージェントの対話を正常に表示します。 XNUMX 日を通してのエージェントのアクティビティの例を以下の図に示します。

 

読むべき生成エージェントの研究論文
一日を通して生成エージェントの活動と交流(公園) 、2023)
 

生成エージェントを作成し、サンドボックス内でシミュレートするためのコード全体は、研究者によってすでにオープンソースとして公開されています。これは以下で確認できます。 倉庫。 指示は非常にシンプルなので、問題なく従うことができます。

生成エージェントは興味深い分野になりつつあり、これに基づいて多くの研究が行われています。 この記事では、読むべき生成エージェントに関するさまざまな論文を取り上げます。 これらは何ですか? それでは始めましょう。

1. ソフトウェア開発のためのコミュニケーションエージェント

  ソフトウェア開発のためのコミュニケーションエージェントに関する論文 (クアン 、2023) は、生成エージェントを使用してソフトウェア開発に革命を起こす新しいアプローチです。 研究者たちが提案する前提は、大規模言語モデル (LLM) による自然言語コミュニケーションを使用して、ソフトウェア開発プロセス全体をどのように合理化し、統合できるかということです。 タスクには、コードの開発、ドキュメントの生成、要件の分析などが含まれます。

研究者らは、LLM を使用してソフトウェア全体を生成する場合、幻覚と意思決定における反対尋問の欠如という XNUMX つの大きな課題があると指摘しています。 これらの問題に対処するために、研究者らは ChatDev と呼ばれるチャットベースのソフトウェア開発フレームワークを提案しています。

ChatDev フレームワークは、設計、コーディング、テスト、文書化の XNUMX つのフェーズに従います。 各フェーズで、ChatDev はコードレビュー担当者、ソフトウェアプログラマーなど、さまざまな役割を持つ複数のエージェントを確立します。エージェント間の通信がスムーズに実行されるようにするために、研究者らはフェーズを連続したアトミックなサブタスクに分割するチャットチェーンを開発しました。 各サブタスクは、エージェント間のコラボレーションと対話を実装します。

ChatDev フレームワークを以下の図に示します。

 

読むべき生成エージェントの研究論文
提案されている ChatDev フレームワーク (Quan 、2023)
 

研究者たちは、ChatDev フレームワークがソフトウェア開発でどのように機能するかを測定するためにさまざまな実験を実行します。 を使用することで gpt3.5-ターボ-16k, 以下はソフトウェア統計実験のパフォーマンスです。

 

読むべき生成エージェントの研究論文
ChatDev フレームワーク ソフトウェア統計 (Quan 、2023)
 

上記の数値は、ChatDev によって生成されたソフトウェア システムに関する統計分析の指標です。 たとえば、最小で 39 行のコードが生成され、最大で 359 行のコードが生成されます。 研究者らはまた、生成されたソフトウェア システムの 86.66% が適切に動作したことを示しました。

これは、開発者の働き方を変える可能性を示す素晴らしい論文です。 ChatDev の完全な実装を理解するには、論文をさらに読んでください。 完全なコードは ChatDev からも入手できます。 倉庫.

2. AgentVerse: マルチエージェントのコラボレーションを促進し、エージェントの緊急動作を調査する

AgentVerse は、論文で提案されたフレームワークです。 チェンら。、2023 大規模言語モデルを介してエージェント グループをシミュレートし、グループ内での動的な問題解決手順と、進行に基づいたグループ メンバーの調整を行います。 この研究は、自律エージェントが問題解決に適応して進化できない静的なグループ ダイナミクスの課題を解決するために存在します。

AgentVerse フレームワークは、フレームワークを次の XNUMX つのステップに分割しようとします。 

  1. 専門家の採用: エージェントが問題と解決策に合わせて調整するフェーズ
  2. 協調的な意思決定: エージェントは、問題を解決するための解決策と戦略を策定するために話し合います。 
  3. アクションの実行: エージェントは、決定に基づいて環境内でアクションを実行します。
  4. 評価:現状と目標を評価します。 まだ目標を達成する必要がある場合、フィードバック報酬は最初のステップに戻ります。

AgentVerse の全体的な構造を以下の図に示します。

 

読むべき生成エージェントの研究論文
AgentVerse フレームワーク (Chen 、2023)
 

研究者らはフレームワークを実験し、AgentVerse フレームワークと個々のエージェント ソリューションを比較しました。 結果は下の画像に示されています。

 

読むべき生成エージェントの研究論文
AgentVerse のパフォーマンス分析 (Chen) 、2023)
 

AgentVerse フレームワークは、一般に、提示されたすべてのタスクにおいて個々のエージェントよりも優れたパフォーマンスを発揮します。 これは、生成エージェントが問題を解決しようとする個々のエージェントよりも優れたパフォーマンスを発揮できることを証明しています。 彼らを通じてフレームワークを試すことができます 倉庫.

3. AgentSims: 大規模言語モデル評価用のオープンソース サンドボックス

LLM の能力の評価は、コミュニティや分野内でまだ未解決の問題です。 LLM を適切に評価する能力を制限する XNUMX つのポイントは、タスクによる評価能力の制限、脆弱なベンチマーク、および客観的でない指標です。 これらの問題に対処するには、 リン、2023 論文の中で LLM ベンチマークとしてタスクベースの評価を提案しました。 このアプローチは、提起されたすべての問題を軽減できるため、LLM の作品を評価する際の標準になることが期待されていました。 これを実現するために、研究者らは AgentSims と呼ばれるフレームワークを導入しました。

AgentSims は、LLM の評価タスクを管理するための対話型の視覚化インフラストラクチャを備えたプログラムです。 AgentSims の全体的な目的は、研究者や専門家にタスク設計プロセスを合理化し、評価ツールとして使用するためのプラットフォームを提供することです。 AgentSims のフロントエンドを下の図に示します。

 

読むべき生成エージェントの研究論文
AgentSims フロントエンド (リン) 、2023)
 

AgentSims のターゲットは、より簡単な方法で LLM 評価を必要とするすべての人であるため、研究者は UI と対話できるフロントエンドを開発しました。 完全なデモを試すこともできます ウェブサイト または、AgentSims の完全なコードにアクセスします。 倉庫.

生成エージェントは、人間の行動をシミュレートするための LLM における最近のアプローチです。 パーク氏の最新研究、2023 年は、生成エージェントができることの大きな可能性を示しました。 だからこそ、生成エージェントに基づいたさまざまな種類の研究が現れ、多くの新しい扉が開かれてきました。

この記事では、次の XNUMX つの異なる生成エージェントの研究について説明しました。

  1. ソフトウェア開発のためのコミュニケーションエージェントに関する論文 (、2023)
  2. AgentVerse: マルチエージェントのコラボレーションを促進し、エージェントの緊急動作を調査する (チェンら。、2023)

3. AgentSims: 大規模言語モデル評価用のオープンソース サンドボックス (リン、2023)
 
 
コーネリアス・ユダ・ウィジャヤ は、データ サイエンス アシスタント マネージャー兼データ ライターです。 Allianz Indonesia でフルタイムで働いている間、彼はソーシャル メディアやライティング メディアを通じて Python とデータのヒントを共有するのが大好きです。
 

タイムスタンプ:

より多くの KDナゲット