機械学習で生成された画像キャプションを操作する Web アプリを作成する

ソースノード: 1849327

まとめ

でホストされる IBM Model Asset eXchange (MAX) の導入 機械学習交換 データ サイエンスの経験のないアプリケーション開発者が、事前に構築された機械学習モデルに簡単にアクセスできるようになりました。このコード パターンは、MAX モデルを利用する Web アプリの作成がいかに簡単であるかを示しています。 Web アプリは MAX の Image Caption Generator を使用し、モデルによって与えられた説明に基づいて画像をフィルターできるシンプルな Web UI を作成します。

Description

IBM の調査によると、毎日 2.5 京バイトのデータが作成されます。そのデータの多くは、大きなテキスト、音声録音、画像などの非構造化データです。データを使って何か役に立つことをするには、まずデータを構造化データに変換する必要があります。

このコード パターンは、Model Asset Exchange のモデルの 1 つを使用します。Model Asset Exchange は、開発者がオープンソースの深層学習モデルを見つけて実験できる交換所です。具体的には、 画像キャプションジェネレーター 画像にキャプションを付け、画像ベースの画像コンテンツをフィルタリングできる Web アプリケーションを作成します。この Web アプリケーションは、Tornado を使用した軽量の Python サーバーによってサポートされる対話型ユーザー インターフェイスを提供します。サーバーは UI を通じて画像を取り込み、モデルの REST エンドポイントに送信し、生成されたキャプションを UI に表示します。モデルの REST エンドポイントは、MAX で提供される Docker イメージを使用してセットアップされます。 Web UI には、各画像に対して生成されたキャプションと、キャプションに基づいて画像をフィルタリングするためのインタラクティブなワード クラウドが表示されます。

このコードパターンを完了すると、次の方法がわかります。

  • RESTエンドポイントでディープラーニングモデルをデプロイする
  • MAX モデルの REST API を使用して画像のキャプションを生成する
  • モデルのREST APIを使用するWebアプリケーションを実行する

Flow

フロー

  1. サーバーはデフォルトの画像をモデル API に送信し、キャプション データを受信します。
  2. ユーザーは、デフォルトのコンテンツを含む Web UI を操作し、画像をアップロードします。
  3. Web UI はサーバーに画像のキャプション データを要求し、データが返されたときにコンテンツを更新します。
  4. サーバーは画像をモデル API に送信し、キャプション データを受信して​​ Web UI に返します。

説明書

このコードパターンを使用する準備はできましたか? このアプリケーションの実行と使用を開始する方法の詳細については、 README.

出典: https://developer.ibm.com/patterns/create-a-web-app-to-interact-with-machine-learning-generated-image-captions/

タイムスタンプ:

より多くの IBM 開発者