API ベースの関連性トレーニングを使用して Watson Discovery の結果を改善する

ソースノード: 1537609

まとめ

開発者は、IBM Watson Discovery サービスを使用して、コグニティブ、検索、およびコンテンツ分析エンジンをアプリケーションに迅速に追加します。このエンジンを使用すると、非構造化データからパターン、傾向、洞察を特定し、より適切な意思決定を促進できます。場合によっては、より詳細なトレーニングの詳細を提供して、検索結果を即興で表示したい場合があります。関連性トレーニングは、より正確な検索結果を得るために追加のトレーニングを提供する Watson Discovery の機能です。このコード・パターンは、関連性トレーニング API を使用して、Watson Discovery で検索結果を即興で作成する方法を示しています。

説明

開発者は、IBM Watson Discovery サービスを使用して、コグニティブ、検索、およびコンテンツ分析エンジンをアプリケーションに迅速に追加します。このエンジンを使用すると、非構造化データからパターン、傾向、洞察を特定し、より適切な意思決定を促進できます。 Watson Discovery を使用すると、データの取り込み (変換、強化、クリーンアップ、正規化)、保存、クエリを実行して、実用的な洞察を抽出できます。検索とクエリを実行するには、コレクションに挿入されて永続化されるコンテンツが必要です。 Watson Discovery を使用したアプリケーション開発について詳しくは、 コグニティブディスカバリーリファレンスアーキテクチャ.

関連性トレーニングは Watson Discovery の強力な機能であり、適切なアプローチをとれば検索の精度を向上させることができます。 Watson Discovery をトレーニングして、特定の組織または対象領域に対する照会結果の関連性を向上させることができます。 Watson Discovery インスタンスにトレーニング・データを提供すると、サービスは機械学習 Watson テクニックを使用してコンテンツや質問内のシグナルを見つけます。次に、サービスはクエリ結果を並べ替えて、最も関連性の高い結果を上部に表示します。トレーニング データを追加すると、サービス インスタンスが返す結果の順序がより正確になり、より洗練されたものになります。

関連性トレーニングはオプションです。クエリの結果がニーズを満たしている場合は、それ以上のトレーニングは必要ありません。トレーニング用のユースケースの構築の概要については、ブログ投稿「関連性トレーニングを最大限に活用する方法に設立された地域オフィスに加えて、さらにローカルカスタマーサポートを提供できるようになります。」

Watson Discovery での関連性トレーニングは、次の 2 つの方法で実行できます。

Watson Discovery インスタンスに、関連性トレーニングを実行する必要があるかなりの数の質問がある場合、ツールによる方法は、プログラムによる (API を使用した) 方法に比べてはるかに時間がかかる可能性があります。また、API を使用すると、ブラウザーを通じて Watson Discovery インスタンスにオンライン接続する必要もありません。

このコード パターンは、API を使用して関連性トレーニングを実現する方法を示しています。

Flow

Improve Discovery relevancy training flow diagram

  1. クライアント アプリケーションは、関連性トレーニングが必要なクエリごとに自然言語クエリを送信します。
  2. Watson Discovery は、作成された自然言語クエリーごとに一連の文書を返します。
  3. クライアント アプリケーションは、クエリと対応するドキュメントをローカル マシン上の TSV ファイルに保存します。
  4. ユーザーは関連性スコアをドキュメントに割り当て、ファイルを保存します。
  5. アプリケーションは、更新された関連性スコアを使用してファイルにアクセスします。
  6. クライアント・アプリケーションは API を呼び出し、更新された関連性スコアを使用して Watson Discovery コレクション・トレーニングを更新します。
  7. クライアントは、改善された結果を得るために再度クエリを実行します。

説明書

このパターンの詳細な手順については、 README ファイル。 手順は、次の方法を示しています。

  1. IBM Cloud 上にディスカバリー・サービス・インスタンスを作成します。
  2. Watson Discovery でプロジェクトを作成します。
  3. 文書に注釈を付けます。
  4. 関連性トレーニング API を実行するコードを準備します。
  5. 大量の質問に対する関連性トレーニングを実現します。

出典: https://developer.ibm.com/patterns/improve-discovery-results-using-programmatic-relevancy-training/

タイムスタンプ:

より多くの IBM 開発者