機械学習で生成された画像キャプションと対話する Web アプリを作成する

プラトン再発行

フォロワー： 0

まとめ

でホストされる IBM Model Asset eXchange (MAX) の導入機械学習交換データサイエンスの経験のないアプリケーション開発者が、事前に構築された機械学習モデルに簡単にアクセスできるようになりました。このコードパターンは、MAX モデルを利用する Web アプリの作成がいかに簡単であるかを示しています。 Web アプリは MAX の Image Caption Generator を使用し、モデルによって与えられた説明に基づいて画像をフィルターできるシンプルな Web UI を作成します。

Description

IBM の調査によると、毎日 2.5 京バイトのデータが作成されます。そのデータの多くは、大きなテキスト、音声録音、画像などの非構造化データです。データを使って何か役に立つことをするには、まずデータを構造化データに変換する必要があります。

このコードパターンは、Model Asset Exchange のモデルの 1 つを使用します。Model Asset Exchange は、開発者がオープンソースの深層学習モデルを見つけて実験できる交換所です。具体的には、画像キャプションジェネレーター画像にキャプションを付け、画像ベースの画像コンテンツをフィルタリングできる Web アプリケーションを作成します。この Web アプリケーションは、Tornado を使用した軽量の Python サーバーによってサポートされる対話型ユーザーインターフェイスを提供します。サーバーは UI を通じて画像を取り込み、モデルの REST エンドポイントに送信し、生成されたキャプションを UI に表示します。モデルの REST エンドポイントは、MAX で提供される Docker イメージを使用してセットアップされます。 Web UI には、各画像に対して生成されたキャプションと、キャプションに基づいて画像をフィルタリングするためのインタラクティブなワードクラウドが表示されます。

このコードパターンを完了すると、次の方法がわかります。

RESTエンドポイントでディープラーニングモデルをデプロイする
MAX モデルの REST API を使用して画像のキャプションを生成する
モデルのREST APIを使用するWebアプリケーションを実行する

Flow

フロー

サーバーはデフォルトの画像をモデル API に送信し、キャプションデータを受信します。
ユーザーは、デフォルトのコンテンツを含む Web UI を操作し、画像をアップロードします。
Web UI はサーバーに画像のキャプションデータを要求し、データが返されたときにコンテンツを更新します。
サーバーは画像をモデル API に送信し、キャプションデータを受信して Web UI に返します。

説明書

このコードパターンを使用する準備はできましたか？このアプリケーションの実行と使用を開始する方法の詳細については、 README.

出典: https://developer.ibm.com/patterns/create-a-web-app-to-interact-with-machine-learning-generated-image-captions/

タイムスタンプ： 2019 年 3 月 27 日

タイムスタンプ： 2020 年 7 月 9 日

機械学習で生成された画像キャプションを操作する Web アプリを作成する

プラトン再発行

まとめ

Description

Flow

説明書

より多くの IBM 開発者

コンピュータービジョンの深層学習モデルを検証する

Watson Machine Learningを使用してリアルタイムのオブジェクト検出アプリを作成する

ビデオから洞察を抽出する

IBM Maximo Visual Inspection を使用して AI プロジェクトの分析ダッシュボードを開発する

ビデオからオーディオを抽出する

ApacheKafkaからデータを取り込む

AutoAIを使用してパイプラインモデル用のPythonノートブックを生成する

音声をリアルタイムまたは音声ファイルから書き起こします

IBM Maximo Visual Inspection の推論結果をダッシュボードにロードする

自動化された空港セキュリティ制御システムを実装する

話者ダイアライゼーション機能を備えたカスタムの音声テキストモデルを構築する

テキストから人間のような音声を生成する

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー