メディア プラットフォームでのユーザー エンゲージメントと満足度を高めるには、ユーザーが新しいコンテンツを発見する方法を改善することが重要です。キーワード検索だけではセマンティクスやユーザーの意図を捉えるのが難しく、関連するコンテキストを欠いた結果が得られます。たとえば、デートの夜やクリスマスをテーマにした映画を見つけるなどです。これにより、ユーザーが必要なコンテンツを確実に見つけることができない場合、維持率が低下する可能性があります。ただし、 大規模な言語モデル (LLM) には、これらのセマンティックおよびユーザー インテントの課題を解決する機会があります。組み合わせることで 埋め込み と呼ばれる手法でセマンティクスをキャプチャします。 検索拡張生成 (RAG)を使用すると、独自のデータ ソースから取得したコンテキストに基づいて、より関連性の高い回答を生成できます。
この投稿では、を使用して独自のデータを使用して RAG を実装し、ムービー チャットボットを安全に作成する方法を説明します。 知識ベース for アマゾンの岩盤。 IMDb と Box Office Mojo データセットを使用して、メディアとエンターテイメントの顧客向けのカタログをシミュレートし、わずか 2、3 の手順で独自の RAG ソリューションを構築する方法を紹介します。
ソリューションの概要
IMDb とボックス オフィス Mojo 映画/TV/OTT ライセンス可能なデータ パッケージは、1.6 億を超えるユーザー評価を含む幅広いエンターテイメント メタデータを提供します。 13 万人を超えるキャストとスタッフのクレジット。 10 万の映画、テレビ、エンターテイメント タイトル。 および 60 か国以上からのグローバル興行レポート データ。 多くの AWS メディアおよびエンターテイメントのお客様は、IMDb データのライセンスを AWSデータ交換 コンテンツの発見を改善し、顧客の関与と維持を向上させます。
Amazon Bedrock のナレッジベースの概要
LLM に最新の機密情報を提供するために、組織は RAG を使用します。RAG は、企業のデータ ソースからデータを取得し、そのデータでプロンプトを充実させて、より関連性が高く正確な応答を提供する技術です。 Amazon Bedrock のナレッジベースにより、コンテキストおよび関連する企業データを使用して LLM 応答をカスタマイズできるフルマネージド RAG 機能が有効になります。ナレッジ ベースは、取り込み、取得、プロンプト拡張、引用などのエンドツーエンドの RAG ワークフローを自動化し、データ ソースの統合やクエリの管理のためのカスタム コードを作成する必要がなくなります。 Amazon Bedrock のナレッジベースでは、LLM がユーザーの複雑なクエリに正しい答えを返すことができるように、複数ターンの会話も可能です。
このソリューションの一部として、次のサービスを使用します。
次の高レベルの手順を実行します。
- IMDb データを前処理して、すべての映画レコードからドキュメントを作成し、データを Amazon シンプル ストレージ サービス (Amazon S3)バケット。
- ナレッジベースを作成します。
- ナレッジ ベースをデータ ソースと同期します。
- ナレッジ ベースを使用して、映画カタログに関する意味論的な質問に答えます。
前提条件
この投稿で使用されている IMDb データには、商用コンテンツ ライセンスと IMDb への有料サブスクリプション、および AWS Data Exchange の Box Office Mojo Movies/TV/OTT ライセンス パッケージが必要です。ライセンスについて問い合わせてサンプル データにアクセスするには、次のサイトにアクセスしてください。 development.imdb.com。データセットにアクセスするには、を参照してください。 IMDb ナレッジ グラフを使用した電力の推奨と検索 – パート 1 そして、フォロー IMDb データにアクセスする のセクションから無料でダウンロードできます。
IMDb データの前処理
ナレッジベースを作成する前に、IMDb データセットをテキスト ファイルに前処理し、S3 バケットにアップロードする必要があります。この投稿では、IMDb データセットを使用して顧客カタログをシミュレートします。カタログ用に IMDb データセットから 10,000 本の人気映画を取得し、データセットを構築します。
以下を使用してください ノート 俳優、監督、プロデューサー名などの追加情報を含むデータセットを作成します。次のコードを使用して、LLM が理解できる非構造化テキストでファイルに保存されているすべての情報を含むムービー用の 1 つのファイルを作成します。
データを .txt 形式で取得したら、次のコマンドを使用してデータを Amazon S3 にアップロードできます。
IMDb ナレッジベースを作成する
ナレッジ ベースを作成するには、次の手順を実行します。
- Amazon Bedrock コンソールで、 知識ベース ナビゲーションペインに表示されます。
- 選択する 知識ベースを作成する.
- ナレッジベース名、 入る
imdb
. - ナレッジベースの説明、オプションの説明 (imdb データの取り込みと保存に関するナレッジベースなど) を入力します。
- IAM権限選択 新しいサービスロールを作成して使用するをクリックし、新しいサービス ロールの名前を入力します。
- 選択する Next.
- データソース名、 入る
imdb-s3
. - S3 URI、データをアップロードした S3 URI を入力します。
- 詳細設定 - オプション セクション、 チャンク戦略、選択する チャンキングなし.
- 選択する Next.
ナレッジ ベースを使用すると、ドキュメントを小さなセグメントに分割して、大きなドキュメントを簡単に処理できるようになります。私たちの場合、データはすでに小さなサイズのドキュメント (ムービーごとに 1 つ) に分割されています。
- ベクトルデータベース セクション、選択 新しいベクター ストアを簡単に作成する.
Amazon Bedrock は、フルマネージドの OpenSearch サーバーレス ベクトル検索コレクションを自動的に作成し、選択した Titan Embedding G1 – テキスト埋め込みモデルを使用してデータ ソースを埋め込むための設定を構成します。
- 選択する Next.
- 設定を確認して、 知識ベースを作成する.
データをナレッジベースと同期する
ナレッジ ベースを作成したので、ナレッジ ベースをデータと同期できます。
- Amazon Bedrock コンソールで、ナレッジベースに移動します。
- 情報元 セクションでは、選択 同期.
データ ソースが同期されたら、データをクエリする準備が整います。
セマンティック結果を使用して検索を改善する
ソリューションをテストし、セマンティック結果を使用して検索を改善するには、次の手順を実行します。
- Amazon Bedrock コンソールで、ナレッジベースに移動します。
- ナレッジベースを選択して選択してください テストの知識ベース.
- 選択する モデルを選択、選択して 人間的クロード v2.1.
- 選択する 申し込む.
これで、データをクエリする準備が整いました。
「クリスマスをテーマにした映画をいくつかお勧めしてください」など、意味論的な質問をすることができます。
ナレッジベースの回答には引用が含まれており、回答の正確性と事実性を調べることができます。
これらのムービーから必要な情報をドリルダウンすることもできます。次の例では、「ナイトメア・ビフォア・クリスマスの監督は誰ですか?」と尋ねます。
「評価が 7 を超える古典的なアニメ映画を見せてください」など、ジャンルや評価に関連したより具体的な質問をすることもできます。
エージェントを使用して知識ベースを強化する
Amazon Bedrock のエージェント 複雑なタスクを自動化するのに役立ちます。エージェントはユーザーのクエリを小さなタスクに分割し、カスタム API またはナレッジ ベースを呼び出して、アクションを実行するための情報を補足できます。 Agents for Amazon Bedrock を使用すると、開発者はインテリジェントなエージェントをアプリに統合して、AI を活用したアプリケーションの配信を加速し、開発時間を数週間節約できます。エージェントを使用すると、からのレコメンデーションなどの機能を追加してナレッジ ベースを強化できます。 Amazonパーソナライズ ユーザー固有の推奨事項や、ユーザーのニーズに基づいた映画のフィルタリングなどのアクションを実行します。
まとめ
この投稿では、独自のデータと IMDb および Box Office Mojo Movies/TV/OTT ライセンス データセットに基づいたセマンティック検索と会話エクスペリエンスに応えるために、Amazon Bedrock を使用して会話型ムービー チャットボットをいくつかの手順で構築する方法を説明しました。次回の投稿では、Agents for Amazon Bedrock を使用してソリューションに機能を追加するプロセスについて説明します。 Amazon Bedrock のナレッジベースの使用を開始するには、以下を参照してください。 Amazon Bedrock のナレッジベース.
著者について
ガウラヴ・レレ 彼は、ジェネレーティブ AI イノベーション センターのシニア データ サイエンティストであり、さまざまな業種にわたる AWS の顧客と連携して、ビジネス課題を解決するためのジェネレーティブ AI と AWS クラウド サービスの使用を促進しています。
ディヴィヤ・バルガヴィ 彼女は、生成 AI イノベーション センターの上級応用科学者リードであり、生成 AI 手法を使用して AWS の顧客の価値の高いビジネス上の問題を解決しています。彼女は、画像/ビデオの理解と検索、ナレッジ グラフの拡張された大規模な言語モデル、およびパーソナライズされた広告のユースケースに取り組んでいます。
スレン・グントゥル 彼は、ジェネレーティブ AI イノベーション センターで働くデータ サイエンティストであり、さまざまな AWS 顧客と協力して価値の高いビジネス上の問題を解決しています。彼は、主に Amazon Bedrock やその他の AWS クラウド サービスを通じて、大規模言語モデルを使用した ML パイプラインの構築を専門としています。
ヴィディヤ・サーガル・ラヴィパティ Generative AI イノベーション センターのサイエンス マネージャーを務めており、大規模分散システムにおける豊富な経験と機械学習への情熱を活用して、さまざまな業界の AWS 顧客が AI とクラウドの導入を加速できるよう支援しています。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/build-a-movie-chatbot-for-tv-ott-platforms-using-retrieval-augmented-generation-in-amazon-bedrock/
- :持っている
- :は
- :どこ
- 10万ドル
- 000
- 1
- 10
- 100
- 11
- 118
- 12
- 13
- 360
- 385
- 60
- 7
- a
- 私たちについて
- 加速する
- 加速している
- アクセス
- 正確な
- 越えて
- 行動
- 俳優
- 追加
- NEW
- 養子縁組
- 広告運用
- エージェント
- AI
- AI電源
- すべて
- ことができます
- 一人で
- 既に
- また
- Amazon
- Amazon Webサービス
- an
- および
- 回答
- 回答
- どれか
- API
- 適用された
- アプリ
- です
- AS
- 頼む
- At
- 増強
- 増強された
- 自動化する
- 自動的に
- AWS
- ベース
- ベース
- BE
- 10億
- ボックス
- 興行収入
- ブレーク
- ビルド
- 建物
- ビジネス
- by
- コール
- 呼ばれます
- 缶
- 機能
- キャプチャー
- キャプチャ
- 場合
- 例
- カタログ
- センター
- 課題
- チャットボット
- 選択する
- 選ばれた
- クリスマス
- クラシック
- クラウド
- クラウドの採用
- クラウドサービス
- コード
- コレクション
- 結合
- コマーシャル
- 会社
- 複雑な
- 領事
- 含む
- コンテンツ
- コンテキスト
- 文脈上の
- 会話
- 会話
- 正しい
- 国
- カップル
- 作ります
- 作成した
- Applied Deposits
- クルー
- 重大な
- カスタム
- 顧客
- 顧客エンゲージメント
- Customers
- カスタマイズ
- データ
- データ交換
- データサイエンティスト
- 日付
- 配信する
- 配達
- 説明
- 細部
- 開発者
- 開発
- 異なります
- 指示された
- 取締役
- 取締役
- 発見する
- 発見
- 配布
- 分散システム
- ドキュメント
- ドキュメント
- ダウン
- ドライブ
- 排除
- 埋め込み
- enable
- 端から端まで
- 婚約
- 濃縮
- 入力します
- エンターテインメント
- エーテル(ETH)
- あらゆる
- 例
- 交換
- 体験
- エクスペリエンス
- 探る
- 少数の
- File
- フィルタリング
- もう完成させ、ワークスペースに掲示しましたか?
- 発見
- フォロー中
- 形式でアーカイブしたプロジェクトを保存します.
- から
- 完全に
- 機能性
- g1
- 生成する
- 世代
- 生々しい
- 生成AI
- ジャンル
- 取得する
- グローバル
- Go
- グラフ
- 大きい
- 持ってる
- he
- 助けます
- ハイレベル
- 彼の
- 認定条件
- How To
- しかしながら
- HTML
- HTTP
- HTTPS
- if
- 実装
- 改善します
- in
- 含めて
- 増える
- 産業を変えます
- info
- 情報
- 革新的手法
- 問い合わせます
- 統合する
- インテリジェント-
- 意図
- に
- 関与
- IT
- JPG
- ただ
- 知識
- 欠如
- 言語
- 大
- 大規模
- つながる
- 主要な
- 学習
- レバレッジ
- ライセンス
- ライセンス供与
- ライセンシング
- ような
- LLM
- ローカル
- 場所
- 下側
- 機械
- 機械学習
- make
- 管理します
- マネージド
- マネージャー
- 多くの
- me
- メディア
- メンバー
- メソッド
- 百万
- ML
- モデル
- モジョ
- 他には?
- 映画
- 動画
- 名
- 名
- ナビゲート
- ナビゲーション
- 必要
- ニーズ
- 新作
- 次の
- 夜
- of
- Office
- on
- ONE
- 機会
- or
- 組織
- その他
- 私たちの
- が
- 自分の
- パッケージ
- ページ
- 支払われた
- ペイン
- 部
- 情熱
- path
- 以下のために
- 実行
- カスタマイズ
- プラットフォーム
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- プロット
- 人気
- ポスト
- ポスター
- 主に
- 問題
- プロセス
- プロデューサー
- 生産者
- 所有権
- は、大阪で
- クエリ
- クエリー
- 質問
- ぼろ
- 範囲
- 価格表
- 評価
- 評価
- 準備
- 推奨する
- おすすめ
- 提言
- 記録
- 参照する
- 関連する
- 関連した
- 各種レポート作成
- 必要
- 応答
- 回答
- 結果
- 保持
- 検索
- return
- 職種
- 行
- ランニング
- 満足
- 節約
- 科学
- 科学者
- を検索
- セクション
- しっかりと
- セグメント
- select
- セマンティック
- 意味論
- シニア
- サーバレス
- サービス
- サービス
- 設定
- 彼女
- ショット
- 表示する
- ショーケース
- 示されました
- 簡単な拡張で
- シミュレートする
- サイズ
- より小さい
- So
- 溶液
- 解決する
- 解決する
- 一部
- ソース
- ソース
- 専門にする
- 特定の
- 開始
- ステップ
- ストレージ利用料
- 店舗
- 保存され
- 簡単な
- 購読
- そのような
- 補足
- 同期。
- システム
- 取る
- タスク
- 技術
- test
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
- より
- それ
- 情報
- アプリ環境に合わせて
- それら
- テーマ別
- その後
- そこ。
- ボーマン
- 彼ら
- この
- 介して
- 時間
- タイタン
- タイトル
- 〜へ
- tv
- 理解する
- 理解された
- 非構造化
- 最新
- アップロード
- URI
- URL
- つかいます
- 中古
- ユーザー
- users
- さまざまな
- 広大な
- 垂直
- 訪問
- W
- 歩く
- 欲しいです
- ました
- we
- ウェブ
- Webサービス
- ウィークス
- ワイド
- 広い範囲
- 意志
- ワークフロー
- ワーキング
- 作品
- 書きます
- X
- 年
- 貴社
- あなたの
- ゼファーネット