私たちは、人工知能 (AI) を含むあらゆる分野に責任ある研究とコミュニティが関与する研究を追求することに深く取り組んでいます。 私たちは、透明性、外部からの検証、そして協力と後援による学術機関の支援を通じてこれを実現します。 このアプローチにより、生成 AI、データセンターの拡張、オンラインの安全性という XNUMX つの重点分野での最大の進歩の達成を加速することができます。 本日は、XNUMX つの生成 AI 研究プロジェクトからの洞察と結果を共有します。 コントロールネット は、より正確な画像出力を実現するために画像生成モデルに条件付き制御を追加するオープンソースのニューラル ネットワークです。 スターコーダー は、コード生成用の最先端のオープンソース大規模言語モデル (LLM) です。
どちらのプロジェクトも学術と業界のコラボレーションです。 どちらも、クリエイター、つまり 3D アーティストやプログラマーのための、根本的により強力なツールにも焦点を当てています。 最も重要なことは、革新的な研究を通じて長期的な視点に投資するという私たちの使命と一致しており、これらのプロジェクトは、多くのアプリケーションに対する AI の基本的な科学的理解と制御における進歩の兆候を示しています。 私たちは、この研究がRobloxの将来とこの分野全体に重大な影響を与える可能性があると信じており、それを率直に共有できることを誇りに思っています。
コントロールネット
最近の AI の進歩、特にディープ ニューラル ネットワークを使用したデータ駆動型機械学習 (ML) 手法は、作成ツールの新たな進歩を推進しました。 これらの進歩には、 コードアシスト および マテリアルジェネレーター これらの機能は、無料ツール Roblox Studio で公開されています。 最新の生成 AI システムには、数十億回のトレーニング操作を通じて洗練されたモデルと呼ばれるデータ構造が含まれています。 現在最も強力なモデルはマルチモーダルです。つまり、テキスト、画像、音声などのメディアの混合でトレーニングされます。 これにより、カラー パレットやスペルなどのデータ セットの特定の要素に過剰適合するのではなく、メディア全体で共通の根底にある意味を見つけることができます。
これらの新しい AI システムは優れた表現力を持っていますが、その力は主に「迅速なエンジニアリング」によって導かれます。 これは、期待した結果が返されなかった場合に検索エンジンのクエリを調整するのと同様に、単に入力テキストを変更することを意味します。 これは、無指向性チャットボットなどの新しいテクノロジーを活用するには魅力的な方法かもしれませんが、コンテンツを作成する効率的または効果的な方法ではありません。 クリエイターは代わりに、推測ではなくアクティブなコントロールを通じて効果的に活用できる強力なツールを必要としています。
ControlNet プロジェクトは、これらの課題のいくつかを解決するための一歩です。 これは、次のような大規模な事前トレーニングされた AI モデルの力を活用する効率的な方法を提供します。 安定拡散、迅速なエンジニアリングに依存せずに。 ControlNet は、アーティストが単なるテキスト プロンプトを超えた追加の入力条件を提供できるようにすることで、制御を強化します。 Roblox の研究者でスタンフォード大学教授の Maneesh Agrawala 氏とスタンフォード研究者の Lvmin Zhang 氏は、共同 ControlNet プロジェクトの目標を次のように定めています。
- 生成 AI ツール用のより優れたユーザー インターフェイスを開発します。 曖昧なプロンプト操作を超えて、アイデアや創造的なコンセプトを伝えるためのより自然な方法を構築します。
- より緻密な空間制御により、「こんな絵」「~っぽい絵」を作るだけでなく、作り手の頭の中にあるイメージをそのまま具現化することができます。
- 生成的 AI トレーニングを、より高速に実行され、必要なメモリと電力消費量が少ない、より計算効率の高いプロセスに変換します。
- 画像生成 AI を再利用可能な構成要素に拡張します。 その後、標準化された画像処理および 3D レンダリング パイプラインと統合できます。
ControlNet では、作成者が空間制御用の追加画像を提供できるようにすることで、最終的に生成される画像をより詳細に制御できるようになります。 たとえば、既存のテキスト画像ジェネレーターで「角のある雄の鹿」というプロンプトを表示すると、以下に示すようなさまざまな画像が生成されました。
以前の AI ソリューションで生成されたこれらの画像は魅力的ですが、残念ながら本質的に恣意的な結果であり、制御することができません。 これらの以前の画像生成システムでは、テキスト プロンプトを修正する以外に出力を制御する方法はありません。
ControlNet を使用すると、作成者はさらに大きな権限を得ることができます。 ControlNet を使用する XNUMX つの方法は、プロンプトとソース イメージの両方を提供して、従うべき一般的な形状を決定することです。 この場合、結果として得られる画像は依然として多様性を提供しますが、重要なことに、指定された形状は保持されます。
作成者は、一連のエッジ、まったくプロンプトのない画像、またはシステムに表現力豊かな入力を提供する他の多くの方法を指定することもできます。
ControlNet を作成するには、大規模な拡散モデルのネットワーク内のウェイトを XNUMX つのバージョンに複製します。 XNUMXつは、 トレーニング可能なネットワーク (これは制御を提供します。これは「ControlNet」です)、もう XNUMX つは ロックされたネットワーク。 ロックされたネットワークは、数十億の画像から学習した機能を保存しており、以前の画像ジェネレーターである可能性があります。 次に、追加の画像から条件付き制御を学習するために、タスク固有のデータ セットで訓練可能なネットワークを訓練します。 トレーニング可能でロックされたコピーは、私たちが呼ぶ独自のタイプの畳み込み層に接続されています。 ゼロ畳み込みここで、畳み込みの重みは、学習された方法でゼロから最適化されたパラメーターまで徐々に増加します。これは、最初は影響がなく、システムがロックされたネットワークに及ぼす最適な制御レベルを導き出すことを意味します。
元の重みがロックされたネットワークを介して保存されるため、モデルはさまざまなサイズのトレーニング データセットで適切に機能します。 また、ゼロ畳み込み層によりプロセスが大幅に高速化され、新しい層を最初からトレーニングするよりも拡散モデルの微調整に近いものになります。
私たちは、画像生成のためのこの技術について広範な検証を行ってきました。 ControlNet は、出力画像の品質を向上させるだけではありません。 また、特定のタスクに向けたネットワークのトレーニングがより効率的になり、何百万人ものクリエイター向けに大規模に展開するのが現実的になります。 実験では、ControlNet は、モデルを完全に再トレーニングする必要がある別のシナリオと比較して、最大 10 倍の効率向上を実現します。 新しいモデルの作成プロセスは従来のソフトウェア開発に比べて時間とリソースを大量に消費するため、この効率は非常に重要です。 トレーニングをより効率的にすることで、電力が節約され、コストが削減され、新しい機能の追加率が向上します。
ControlNet の独自の構造は、さまざまなサイズおよびさまざまな種類のメディア上のトレーニング データ セットを適切に処理できることを意味します。 ControlNet は、写真、手書きの落書き、 オープンポーズ 姿勢検出。 私たちは、ControlNet を生成 AI コンテンツのさまざまな種類のメディアに適用できると考えています。 これ 研究はオープンで公開されています コミュニティが実験して構築できるように、私たちはさらに多くの発見があれば、より多くの情報を提示し続けます。
スターコーダー
生成 AI は、画像、音声、テキスト、プログラム ソース コード、またはその他の形式のリッチ メディアの生成に適用できます。 ただし、さまざまなメディアにわたって、最も大きな成功を収めたアプリケーションは、出力が主観的に判断されるアプリケーションである傾向があります。 たとえば、画像は人間の視聴者の興味を引くときに成功します。 画像全体が魅力的であれば、エッジの奇妙な特徴や手の余分な指など、画像内の特定のエラーに気付かない場合があります。 同様に、詩や短編小説には文法上の誤りや論理的な飛躍があるかもしれませんが、要点が説得力がある場合には、それらを許容する傾向があります。
主観的な基準を考慮する別の方法は、結果空間が連続的であるということです。 ある結果が別の結果よりも優れている可能性がありますが、その結果が完全に許容できるか許容できないかの特定のしきい値はありません。 他の領域やメディア形式の場合、出力は客観的に判断されます。 たとえば、生成 AI プログラミング アシスタントによって生成されたソース コードは、正しいか正しくないかのどちらかです。 コードがテストに合格できない場合、それが有効なソリューションのコードに似ていても、コードは失敗します。 これは離散結果空間です。 離散空間で成功することは、基準がより厳格であることと、適切な解決策に徐々に近づくことができないため、コードが突然機能するまで壊れているため、より困難です。
テキスト出力に使用される LLM は、チャットボットなどの主観的で継続的なアプリケーションに適しています。 また、英語やフランス語など、多くの人間の言語での散文の生成にも適しているようです。 ただし、既存の LLM は、次の場合にはうまく機能しないようです。 プログラミング 人間の言語と同じように。 コードは数学の一形式であり、自然言語とはまったく異なる客観的な意味表現方法です。 これは、連続的な結果空間ではなく、離散的な結果空間です。 Roblox 作成者向けに最高品質のプログラミング言語コード生成を実現するには、この離散的で客観的な空間で適切に機能する LLM を適用する方法が必要です。 また、Lua、JavaScript、Python など、特定の言語構文に依存しないコード機能を表現するための堅牢な方法も必要です。
コード生成用の新しい最先端のオープンソース LLM である StarCoder は、この技術的課題に対する大きな進歩であり、誰にとっても真にオープンな LLM です。 StarCoder は、 ビッグコード 研究コンソーシアムには、学術研究機関および業界研究機関の 600 名を超えるメンバーが参加しています。 Roblox の研究者であり、ノースイースタン大学教授の Arjun Guha 氏は、このチームを率いて StarCoder を開発するのに貢献しました。 これらの最初に公開された結果は、主観的な手法が相対的に成功していることを考慮すると、この分野で新たな成長が最も必要とされている領域であるコードの側面にのみ焦点を当てています。
大規模な AI エコシステムと Roblox コミュニティをサポートする LLM を通じて生成 AI を提供するには、適切にライセンスされ、責任を持って収集されたデータセットのみを使用してトレーニングされたモデルが必要です。 これらには、誰でも使用し、その上に構築し、エコシステムに貢献できるように、無制限のライセンスも付与する必要があります。 現在、最も強力な LLM は独自のものであるか、限定された形式の商用利用が許可されており、研究者がモデル自体を実験する能力は禁止または制限されています。 対照的に、StarCoder は真のオープン モデルであり、産業界と学術研究者の連合によって作成され、あらゆる規模の商業用途に制限なくライセンスされています。 StarCoder は、責任を持って収集され、適切にライセンスされたコンテンツのみを対象としてトレーニングされています。 モデルは当初、公開コードでトレーニングされており、自分のコードをトレーニングに使用したくない場合はオプトアウト プロセスを利用できます。
現在、StarCoder は、Python、C++、Java を含む 86 の異なるプログラミング言語で動作します。 この論文が出版された時点では、複数の言語をサポートするすべてのオープン コード LLM よりも優れたパフォーマンスを示しており、多くのクローズドな独自モデルとさえ競合していました。
StarCoder LLM はエコシステムへの貢献ですが、私たちの研究目標はさらに深いものです。 この研究の最大の効果は、コード、テキスト、画像、音声、ビデオを含む客観的および主観的なマルチモーダル モデルのセマンティック モデリングを進歩させ、ドメイン転送技術を通じてトレーニング効率を向上させることです。 また、ソースコード生成などの客観的なタスクに対する生成 AI の保守性と制御性についても深い洞察が得られると期待しています。 新しいテクノロジーの興味深いデモンストレーションと、ユーザー コミュニティに価値をもたらす安全で信頼性が高く効率的な製品の間には大きな違いがあります。 ML モデルでは、メモリ フットプリント、省電力、実行時間のパフォーマンスを最適化します。 また、堅牢なインフラストラクチャを開発し、AI コアをシステムの他の部分に接続するソフトウェアで囲み、新機能の追加に応じて頻繁に更新できるシームレスなシステムを開発しました。
Roblox の科学者とエンジニアを科学コミュニティの最も鋭い頭脳と結集させることは、当社が画期的なテクノロジーを追求する上で重要な要素です。 私たちはこれらの初期の結果を共有できることを誇りに思い、研究コミュニティに私たちと関わり、これらの進歩をさらに発展させるよう呼びかけます。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 自動車/EV、 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- チャートプライム。 ChartPrime でトレーディング ゲームをレベルアップしましょう。 こちらからアクセスしてください。
- ブロックオフセット。 環境オフセット所有権の近代化。 こちらからアクセスしてください。
- 情報源: https://blog.roblox.com/2023/09/controlnet-starcoder-roblox-research-advancements-generative-ai/
- :持っている
- :は
- :not
- :どこ
- $UP
- 1
- 3d
- 3Dレンダリング
- a
- 能力
- アカデミック
- 加速する
- ことができます。
- 達成する
- 達成する
- 越えて
- アクティブ
- 追加されました
- NEW
- 追加
- 進める
- 進歩
- 進歩
- 前進
- AI
- AIモデル
- 愛の研究
- AIシステム
- AIトレーニング
- 整列した
- すべて
- 許可
- ことができます
- また
- 代替案
- an
- および
- 別の
- どれか
- 誰も
- 上訴
- 申し込み
- 適用された
- 適用
- アプローチ
- 適切に
- です
- AREA
- エリア
- 周りに
- 人工の
- 人工知能
- 人工知能(AI)
- アーティスト
- Artists
- AS
- 側面
- アシスタント
- At
- 魅力的
- オーディオ
- 利用できます
- バック
- BE
- くま
- なぜなら
- き
- 信じる
- 以下
- より良いです
- の間に
- 越えて
- ビッグ
- 億
- ブロック
- ブログ
- 両言語で
- 画期的な
- ブレークスルー
- もたらす
- 壊れた
- ビルド
- 建物
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- C + +
- コール
- 呼ばれます
- 缶
- 機能
- 場合
- センター
- 一定
- 挑戦する
- 課題
- 変化
- チャットボット
- チャットボット
- 閉まっている
- クローザー
- 連合
- コード
- 環境、テクノロジーを推奨
- コラボレーション
- カラー
- コマーシャル
- コミットした
- コマンドと
- 通信中
- コミュニティ
- 比べ
- 説得力のある
- 競争力のある
- 完全に
- コンポーネント
- コンセプト
- 条件
- お問合せ
- 交流
- 保全
- 考えると
- コンソーシアム
- 含む
- コンテンツ
- 続ける
- 連続的な
- コントラスト
- 貢献する
- 貢献
- コントロール
- コピー
- 基本
- 正しい
- コスト
- 可能性
- 作ります
- 作成した
- 作成
- 創造
- クリエイティブ
- クリエイター
- クリエイター
- 基準
- 重大な
- 決定的に
- データ
- データセンター
- データセット
- データセット
- データ駆動型の
- 深いです
- ディープニューラルネットワーク
- より深い
- 鹿
- 配信する
- 展開します
- 検出
- 決定する
- 開発する
- 発展した
- 開発
- 違い
- 異なります
- do
- そうではありません
- すること
- ドメイン
- ドント
- ドリブン
- 早い
- エコシステム
- 効果的な
- 効果的に
- 効率
- 効率的な
- どちら
- 電気
- 要素は
- 新興の
- 新興テクノロジー
- enable
- エネルギー
- 従事する
- 従事して
- 魅力的
- エンジン
- エンジニアリング
- エンジニア
- 英語
- エラー
- 本質的に
- さらに
- あらゆる
- 誰も
- 正確に
- 例
- 除く
- 排他的に
- 実行する
- 実行
- 展示
- 既存の
- 期待する
- 予想される
- 実験
- 実験
- 表現力豊かな
- 広範囲
- 外部
- 余分な
- 失敗
- 速いです
- 特徴
- フィールド
- ファイナル
- もう完成させ、ワークスペースに掲示しましたか?
- 指
- 名
- フォーカス
- 焦点を当て
- フットプリント
- フォーム
- フォーム
- FRAME
- 無料版
- フランス語
- 頻繁な
- から
- 完全に
- 機能性
- 基本的な
- 未来
- 利得
- 集まった
- 生成された
- 生成
- 世代
- 生々しい
- 生成AI
- ジェネレータ
- 与えられた
- Go
- 目標
- 目標
- ゴエス
- 良い
- 助成
- 大きい
- 最大
- 成長する
- 成長性
- ハンド
- もっと強く
- ハーネス
- 持ってる
- 助けました
- 最高
- しかしながら
- HTTPS
- 人間
- アイデア
- if
- 画像
- 画像生成
- 画像
- 影響
- 改善します
- in
- include
- 含めて
- 増える
- 増加
- 独立しました
- 適応症
- 産業を変えます
- 影響
- 情報
- インフラ
- 当初
- 洞察
- を取得する必要がある者
- 機関
- 統合された
- インテリジェンス
- インタフェース
- に
- 興味をそそる
- 投資
- 招待
- 関与
- IT
- ITS
- 自体
- Java
- JavaScriptを
- ジョイント
- JPG
- と判断
- ただ
- キー
- ラボ
- 言語
- ESL, ビジネスESL <br> 中国語/フランス語、その他
- 大
- 主として
- より大きい
- 層
- 層
- つながる
- 飛躍
- LEARN
- 学んだ
- 学習
- less
- レベル
- 活用します
- ライセンス供与
- ライセンス
- 限定的
- 制限
- ロック
- 論理的な
- 長い
- 機械
- 機械学習
- 主要な
- make
- 作る
- 作成
- 操作
- 方法
- 多くの
- 数学
- 最大幅
- 五月..
- 意味
- 意味
- 手段
- メディア
- メンバー
- メモリ
- メソッド
- 何百万
- マインド
- 心
- ミッション
- 混合
- ML
- モダリティ
- モデリング
- モデル
- モダン
- 他には?
- もっと効率的
- 最も
- ずっと
- の試合に
- ナチュラル
- 自然言語
- 必要
- ニーズ
- ネットワーク
- ネットワーク
- ニューラル
- ニューラルネットワーク
- ニューラルネットワーク
- 新作
- 新しい特徴
- いいえ
- 東北大学
- 今
- 客観
- 客観的に
- of
- 提供
- オファー
- on
- ONE
- オンライン
- 開いた
- オープンソース
- 公然と
- 業務執行統括
- 最適な
- 最適化
- 最適化
- or
- オリジナル
- その他
- 私たちの
- 優れたパフォーマンス
- 出力
- が
- 全体
- パラメータ
- 特定の
- パス
- パフォーマンス
- 実行
- 写真
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- プレイ
- 電力
- 強力な
- 実用的
- 正確な
- 好む
- 前
- プロセス
- 処理
- 作り出す
- 生産された
- プロダクト
- 東京大学大学院海洋学研究室教授
- 演奏曲目
- プログラマ
- プログラミング
- プログラミング言語
- 徐々に
- プロジェクト
- プロジェクト(実績作品)
- 所有権
- 誇りに思う
- 提供します
- は、大阪で
- 提供
- 公共
- 出版
- 公然と
- 公表
- 追求
- Python
- 品質
- すぐに
- 根本的に
- レート
- むしろ
- 実現
- 軽減
- 洗練された
- 精錬
- 相対
- 信頼性のある
- 信頼
- レンダリング
- 必要とする
- 必要
- 研究
- 研究コミュニティ
- 研究者
- 研究者
- リソースを大量に消費する
- 責任
- REST
- 結果
- 結果として
- 結果
- 保持
- return
- 再利用可能な
- 富裕層
- 右
- ROBLOX
- 堅牢な
- 安全性
- 規模
- スケーリング
- シナリオ
- 科学的な
- 科学者たち
- スクラッチ
- シームレス
- を検索
- 検索エンジン
- 安全に
- 思われる
- セッションに
- セット
- 形状
- シェアする
- シェアリング
- 最もシャープ
- ショート
- すべき
- 示す
- 重要
- 同様の
- 単に
- サイズ
- So
- ソフトウェア
- ソフトウェア開発
- 溶液
- ソリューション
- 解決
- 一部
- ソース
- ソースコード
- スペース
- 空間の
- 特定の
- 特に
- 指定の
- スピーチ
- 綴り
- 主催
- スタンフォード
- スタンフォード大学
- 最先端の
- 手順
- まだ
- ストーリー
- 厳格な
- 構造
- 構造
- 研究
- 成功する
- 成功
- そのような
- サポート
- 支援する
- サポート
- 囲まれた
- 構文
- システム
- 仕事
- タスク
- チーム
- 技術的
- テクニック
- テクノロジー
- test
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
- より
- それ
- エリア
- 未来
- ソース
- アプリ環境に合わせて
- それら
- その後
- そこ。
- ボーマン
- 彼ら
- この
- それらの
- 三
- しきい値
- 介して
- 従って
- 時間
- 〜へ
- 今日
- 一緒に
- ツール
- 豊富なツール群
- に向かって
- 伝統的な
- トレーニング
- 訓練された
- トレーニング
- 変形させる
- 透明性
- 真に
- 2
- type
- 根本的な
- 理解する
- 残念ながら
- ユニーク
- 大学
- まで
- 更新版
- に
- us
- つかいます
- 中古
- ユーザー
- ユーザーインターフェース
- 値
- 多様
- さまざまな
- 非常に
- 、
- ビデオ
- 詳しく見る
- ました
- 仕方..
- 方法
- we
- WELL
- この試験は
- いつ
- which
- while
- 誰
- 全体
- ワイド
- 以内
- 無し
- 仕事
- 作品
- でしょう
- 貴社
- ゼファーネット
- ゼロ