ジェネレーティブ エージェントとは、スタンフォード大学と Google の研究者が論文で作った造語です。 生成エージェント: 人間の行動のインタラクティブなシミュレーション (公園 ら., 2023)。 この論文では、生成エージェントは人間の行動を確実にシミュレートする計算ソフトウェアであると研究が説明しています。
この論文では、生成モデル、特に大規模言語モデル (LLM) を実装することによって、エージェントがどのように人間と同じように行動できるか (書く、料理する、話す、投票する、寝るなど) ことができることを紹介しています。 エージェントは、自然言語モデルを利用することで、自分自身、他のエージェント、および環境について推論する機能を示すことができます。
研究者は、大規模な言語モデルを使用して信頼できる動作を生成するために、関連する記憶を保存、合成、および適用するシステム アーキテクチャを構築し、生成エージェントを有効にします。 このシステムは XNUMX つのコンポーネントで構成されており、次のとおりです。
- メモリストリーム。 このシステムはエージェントの経験を記録し、エージェントの今後の行動の参考となります。
- 反射。 システムは、エージェントが学習し、より良いパフォーマンスを発揮できるように、経験を記憶に合成します。
- 計画。 このシステムは、以前のシステムからの洞察を高レベルのアクション プランに変換し、エージェントが環境に反応できるようにします。
これらの反映および計画システムはメモリ ストリームと相乗的に機能し、エージェントの将来の動作に影響を与えます。
上記のシステムをシミュレートするために、研究者らは、シムズ ゲームからインスピレーションを得たエージェントのインタラクティブな社会の構築に焦点を当てました。 上記のアーキテクチャは ChatGPT に接続されており、サンドボックス内での 25 のエージェントの対話を正常に表示します。 XNUMX 日を通してのエージェントのアクティビティの例を以下の図に示します。
一日を通して生成エージェントの活動と交流(公園) ら、2023)
生成エージェントを作成し、サンドボックス内でシミュレートするためのコード全体は、研究者によってすでにオープンソースとして公開されています。これは以下で確認できます。 倉庫。 指示は非常にシンプルなので、問題なく従うことができます。
生成エージェントは興味深い分野になりつつあり、これに基づいて多くの研究が行われています。 この記事では、読むべき生成エージェントに関するさまざまな論文を取り上げます。 これらは何ですか? それでは始めましょう。
1. ソフトウェア開発のためのコミュニケーションエージェント
ソフトウェア開発のためのコミュニケーションエージェントに関する論文 (クアン ら、2023) は、生成エージェントを使用してソフトウェア開発に革命を起こす新しいアプローチです。 研究者たちが提案する前提は、大規模言語モデル (LLM) による自然言語コミュニケーションを使用して、ソフトウェア開発プロセス全体をどのように合理化し、統合できるかということです。 タスクには、コードの開発、ドキュメントの生成、要件の分析などが含まれます。
研究者らは、LLM を使用してソフトウェア全体を生成する場合、幻覚と意思決定における反対尋問の欠如という XNUMX つの大きな課題があると指摘しています。 これらの問題に対処するために、研究者らは ChatDev と呼ばれるチャットベースのソフトウェア開発フレームワークを提案しています。
ChatDev フレームワークは、設計、コーディング、テスト、文書化の XNUMX つのフェーズに従います。 各フェーズで、ChatDev はコードレビュー担当者、ソフトウェアプログラマーなど、さまざまな役割を持つ複数のエージェントを確立します。エージェント間の通信がスムーズに実行されるようにするために、研究者らはフェーズを連続したアトミックなサブタスクに分割するチャットチェーンを開発しました。 各サブタスクは、エージェント間のコラボレーションと対話を実装します。
ChatDev フレームワークを以下の図に示します。
提案されている ChatDev フレームワーク (Quan ら、2023)
研究者たちは、ChatDev フレームワークがソフトウェア開発でどのように機能するかを測定するためにさまざまな実験を実行します。 を使用することで gpt3.5-ターボ-16k, 以下はソフトウェア統計実験のパフォーマンスです。
ChatDev フレームワーク ソフトウェア統計 (Quan ら、2023)
上記の数値は、ChatDev によって生成されたソフトウェア システムに関する統計分析の指標です。 たとえば、最小で 39 行のコードが生成され、最大で 359 行のコードが生成されます。 研究者らはまた、生成されたソフトウェア システムの 86.66% が適切に動作したことを示しました。
これは、開発者の働き方を変える可能性を示す素晴らしい論文です。 ChatDev の完全な実装を理解するには、論文をさらに読んでください。 完全なコードは ChatDev からも入手できます。 倉庫.
2. AgentVerse: マルチエージェントのコラボレーションを促進し、エージェントの緊急動作を調査する
AgentVerse は、論文で提案されたフレームワークです。 チェンら。、2023 大規模言語モデルを介してエージェント グループをシミュレートし、グループ内での動的な問題解決手順と、進行に基づいたグループ メンバーの調整を行います。 この研究は、自律エージェントが問題解決に適応して進化できない静的なグループ ダイナミクスの課題を解決するために存在します。
AgentVerse フレームワークは、フレームワークを次の XNUMX つのステップに分割しようとします。
- 専門家の採用: エージェントが問題と解決策に合わせて調整するフェーズ
- 協調的な意思決定: エージェントは、問題を解決するための解決策と戦略を策定するために話し合います。
- アクションの実行: エージェントは、決定に基づいて環境内でアクションを実行します。
- 評価:現状と目標を評価します。 まだ目標を達成する必要がある場合、フィードバック報酬は最初のステップに戻ります。
AgentVerse の全体的な構造を以下の図に示します。
AgentVerse フレームワーク (Chen ら、2023)
研究者らはフレームワークを実験し、AgentVerse フレームワークと個々のエージェント ソリューションを比較しました。 結果は下の画像に示されています。
AgentVerse のパフォーマンス分析 (Chen) ら、2023)
AgentVerse フレームワークは、一般に、提示されたすべてのタスクにおいて個々のエージェントよりも優れたパフォーマンスを発揮します。 これは、生成エージェントが問題を解決しようとする個々のエージェントよりも優れたパフォーマンスを発揮できることを証明しています。 彼らを通じてフレームワークを試すことができます 倉庫.
3. AgentSims: 大規模言語モデル評価用のオープンソース サンドボックス
LLM の能力の評価は、コミュニティや分野内でまだ未解決の問題です。 LLM を適切に評価する能力を制限する XNUMX つのポイントは、タスクによる評価能力の制限、脆弱なベンチマーク、および客観的でない指標です。 これらの問題に対処するには、 リン ら、2023 論文の中で LLM ベンチマークとしてタスクベースの評価を提案しました。 このアプローチは、提起されたすべての問題を軽減できるため、LLM の作品を評価する際の標準になることが期待されていました。 これを実現するために、研究者らは AgentSims と呼ばれるフレームワークを導入しました。
AgentSims は、LLM の評価タスクを管理するための対話型の視覚化インフラストラクチャを備えたプログラムです。 AgentSims の全体的な目的は、研究者や専門家にタスク設計プロセスを合理化し、評価ツールとして使用するためのプラットフォームを提供することです。 AgentSims のフロントエンドを下の図に示します。
AgentSims フロントエンド (リン) ら、2023)
AgentSims のターゲットは、より簡単な方法で LLM 評価を必要とするすべての人であるため、研究者は UI と対話できるフロントエンドを開発しました。 完全なデモを試すこともできます ウェブサイト または、AgentSims の完全なコードにアクセスします。 倉庫.
生成エージェントは、人間の行動をシミュレートするための LLM における最近のアプローチです。 パーク氏の最新研究 ら、2023 年は、生成エージェントができることの大きな可能性を示しました。 だからこそ、生成エージェントに基づいたさまざまな種類の研究が現れ、多くの新しい扉が開かれてきました。
この記事では、次の XNUMX つの異なる生成エージェントの研究について説明しました。
- ソフトウェア開発のためのコミュニケーションエージェントに関する論文 (泉 ら、2023)
- AgentVerse: マルチエージェントのコラボレーションを促進し、エージェントの緊急動作を調査する (チェンら。、2023)
3. AgentSims: 大規模言語モデル評価用のオープンソース サンドボックス (リン ら、2023)
コーネリアス・ユダ・ウィジャヤ は、データ サイエンス アシスタント マネージャー兼データ ライターです。 Allianz Indonesia でフルタイムで働いている間、彼はソーシャル メディアやライティング メディアを通じて Python とデータのヒントを共有するのが大好きです。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://www.kdnuggets.com/generative-agent-research-papers-you-should-read?utm_source=rss&utm_medium=rss&utm_campaign=generative-agent-research-papers-you-should-read
- :持っている
- :は
- :どこ
- $UP
- 2023
- 25
- 39
- a
- 能力
- 能力
- 私たちについて
- 上記の.
- アクセス
- 達成する
- 行為
- Action
- 行動
- アクティビティ
- 適応する
- 住所
- 調整
- エージェント
- エージェント
- AL
- 整列する
- すべて
- 緩和する
- アリアンツ
- ことができます
- 既に
- また
- an
- 分析
- 分析する
- および
- 申し込む
- アプローチ
- 建築
- です
- 記事
- AS
- アシスタント
- At
- 自律的
- 利用できます
- ベース
- BE
- になる
- になる
- さ
- 以下
- ベンチマーク
- ベンチマーク
- より良いです
- の間に
- by
- 呼ばれます
- 缶
- 機能
- チェーン
- 挑戦する
- 課題
- 変化する
- AI言語モデルを活用してコードのデバッグからデータの異常検出まで、
- チェン
- コード
- コード
- コーディング
- 造られた
- 環境、テクノロジーを推奨
- 共同
- コミュニケーション
- コミュニティ
- 比べ
- コンポーネント
- 条件
- 交流
- 料理
- 可能性
- 作ります
- 作成
- キュレーション
- 電流プローブ
- データ
- データサイエンス
- 中
- 決定
- 意思決定
- デモ
- 設計
- 設計プロセス
- 設計
- 発展した
- 開発者
- 開発者の仕事
- 開発
- 開発
- 異なります
- 方向
- 話し合います
- 分割された
- do
- 文書化する
- ドキュメント
- ドア
- ダイナミック
- ダイナミクス
- E&T
- 各
- 容易
- 有効にする
- end
- 十分な
- 確保
- 全体
- 環境
- 特に
- 確立する
- 等
- 評価する
- 評価
- 評価します
- 評価
- 誰も
- 進化
- 例
- エキサイティング
- 実行します
- 実行
- 存在
- 体験
- エクスペリエンス
- 実験
- 実験
- エキスパート
- 専門家
- 説明
- 探る
- 探る
- 容易化する
- フィードバック
- フィールド
- フィールズ
- もう完成させ、ワークスペースに掲示しましたか?
- 名
- フォーカス
- フォロー中
- 次
- 4
- フレームワーク
- から
- フロント
- フロントエンド
- フル
- さらに
- 未来
- ゲーム
- 一般に
- 生成する
- 生成された
- 生成
- 生々しい
- 生成モデル
- 取得する
- 目標
- 目標
- でログイン
- 素晴らしい
- グループ
- グループの
- ハンドル
- 出来事
- 利用する
- 持ってる
- he
- ハイレベル
- 認定条件
- HTTPS
- 人間
- 人間
- if
- 画像
- 実装する
- 実装
- 実装
- in
- include
- 含めて
- 個人
- インドネシア
- 影響
- インフラ
- 洞察力
- インスピレーションある
- 対話
- 相互作用
- 相互作用
- 相互作用的
- に
- 紹介する
- IT
- JPG
- KDナゲット
- 欠如
- 言語
- 大
- 最新の
- LEARN
- ような
- LIMIT
- 限定的
- LIN
- ライン
- で
- 製
- 主要な
- make
- マネージャー
- 多くの
- だけど
- メディア
- メンバー
- 思い出
- メモリ
- 会った
- メトリック
- メトリック
- 最小
- モデル
- 他には?
- ずっと
- ナチュラル
- 自然言語
- ニーズ
- 新作
- 数
- 客観
- of
- on
- 開いた
- オープンソース
- 開かれた
- or
- その他
- でる
- 優れたパフォーマンス
- 全体
- 紙素材
- 論文
- パーク
- 実行する
- パフォーマンス
- 実行する
- 相
- 計画
- プラン
- プラットフォーム
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- ポイント
- ポイント
- 可能性
- 潜在的な
- PLM platform.
- 前
- 問題
- 問題解決
- 問題
- 手続き
- プロセス
- 演奏曲目
- プログラマ
- 進行
- 正しく
- 提案する
- 提案された
- 証明する
- 提供します
- Python
- 質問
- 隆起した
- 反応する
- 読む
- 最近
- 記録
- 募集
- 感想
- に対する
- 関連した
- 要件
- 必要
- 研究
- 研究者
- 研究者
- 結果
- return
- 革命
- 報いる
- 役割
- runs
- s
- サンドボックス
- 科学
- いくつかの
- シェアする
- すべき
- 表示する
- 示されました
- 示す
- 作品
- 簡単な拡張で
- シムズ
- スムーズに
- 社会
- ソーシャルメディア
- 社会
- ソフトウェア
- ソフトウェア開発
- 溶液
- 解決する
- 解決
- 話す
- split
- 標準
- スタンフォード
- スタンフォード大学
- 統計的
- 統計
- 手順
- ステップ
- まだ
- 店舗
- 戦略
- 流れ
- 流線
- 合理化された
- 構造
- 勉強
- 首尾よく
- システム
- ターゲット
- 仕事
- タスク
- 期間
- テスト
- より
- それ
- サンドボックス
- アプリ環境に合わせて
- それら
- 自分自身
- ボーマン
- 彼ら
- この
- 三
- 介して
- 全体
- ヒント
- 〜へ
- ツール
- 試します
- しよう
- 2
- ui
- わかる
- 統一
- 大学
- つかいます
- さまざまな
- 、
- 可視化
- 投票
- 脆弱な
- 方法
- we
- この試験は
- which
- while
- 誰
- 全体
- なぜ
- 意志
- 以内
- 無し
- 仕事
- 働いていました
- ワーキング
- 作品
- でしょう
- 作家
- 書き込み
- 貴社
- ゼファーネット