車の画像からナンバープレートを識別する物体検出モデルを構築する

ソースノード: 749910

このコードパターンは、 IBM Maximo Visual Inspection の概要 学習経路.

まとめ

このコード パターンでは、光学式文字認識 (OCR) と IBM Maximo Visual Inspection オブジェクト認識サービスを使用して、ナンバー プレートを識別して読み取る方法を学びます。

Description

IBM Maximo Visual Inspection とカスタム推論スクリプトを使用すると、車の画像からナンバー プレートを識別する物体検出モデルを構築できます。 IBM Maximo Visual Inspection オブジェクト認識サービスのモデルは、ナンバー プレートを表す画像の部分を識別できます。次に、カスタム推論後のスクリプトでこの領域をトリミングし、オープンソースを使用してテキストに対して OCR を実行し、ナン​​バー プレートを返すことができます。このユースケースは、職場、集合住宅、ショッピングモールの駐車場などのエリアでの自動ゲートアクセス制御に最適です。

このコードパターンを完了すると、次の方法がわかります。

  • 物体検出モデルを構築する
  • 特定のオブジェクトが検出されたときに後処理スクリプトをトリガーする
  • Pythonを使用する Opencv OCR用の画像を準備するライブラリ
  • Tesseract OCR を調整して特定のフォントを検出する

Flow

OCR license plate flow diagram

  1. ユーザーは、UI または API REST 呼び出しを通じて、車の画像を IBM Maximo Visual Inspection にアップロードします。
  2. PowerAI モデルは画像内のオブジェクトを認識し、画像内のナンバー プレートの位置を示します。
  3. IBM Maximo Visual Inspection 後処理スクリプトは、トリミングされたナンバー プレートの画像をカスタム OCR サーバーに送信します。
  4. Python スクリプトは、次の方法でナンバー プレートの画像を読み込みます。 opencv NumPy 配列として使用され、いくつかの処理アルゴリズムを使用してバックグラウンド ノイズを除去し、プレートの数字を抽出します。
  5. 処理された画像には Tesseract OCR が使用されます。
  6. ユーザーは、ターミナル ログを通じてプレート テキストを含む JSON オブジェクトを受け取ります。

説明書

このパターンの詳細な手順については、 README ファイル。 手順は、次の方法を示しています。

  1. Kubernetes クラスターをデプロイします。
  2. トレーニング イメージを IBM Maximo Visual Inspection にアップロードします。
  3. IBM Maximo Visual Inspection でモデルをトレーニングしてデプロイします。
  4. リポジトリのクローンを作成します。
  5. OCRサーバーを導入します。

まとめ

このコード パターンでは、OCR と IBM Maximo Visual Inspection オブジェクト認識サービスを使用してナンバー プレートを識別して読み取る方法を説明しました。コードパターンは、 IBM Maximo Visual Inspection の概要 学習パス。おめでとう!これで、IBM Maximo Visual Inspection とその高度な機能のいくつかについて基本的に理解できたはずです。ただし、さらに詳しく知りたい場合は、以下を参照してください。 IBM Maximo Visual Inspection ページで見やすくするために変数を解析したりすることができます。

出典: https://developer.ibm.com/patterns/custom-inference-script-for-reading-license-plates-of-cars/

タイムスタンプ:

より多くの IBM 開発者