車の画像からナンバープレートを識別する物体検出モデルを構築する

プラトン再発行

フォロワー： 0

このコードパターンは、 IBM Maximo Visual Inspection の概要学習経路.

まとめ

このコードパターンでは、光学式文字認識 (OCR) と IBM Maximo Visual Inspection オブジェクト認識サービスを使用して、ナンバープレートを識別して読み取る方法を学びます。

Description

IBM Maximo Visual Inspection とカスタム推論スクリプトを使用すると、車の画像からナンバープレートを識別する物体検出モデルを構築できます。 IBM Maximo Visual Inspection オブジェクト認識サービスのモデルは、ナンバープレートを表す画像の部分を識別できます。次に、カスタム推論後のスクリプトでこの領域をトリミングし、オープンソースを使用してテキストに対して OCR を実行し、ナンバープレートを返すことができます。このユースケースは、職場、集合住宅、ショッピングモールの駐車場などのエリアでの自動ゲートアクセス制御に最適です。

このコードパターンを完了すると、次の方法がわかります。

物体検出モデルを構築する
特定のオブジェクトが検出されたときに後処理スクリプトをトリガーする
Pythonを使用する Opencv OCR用の画像を準備するライブラリ
Tesseract OCR を調整して特定のフォントを検出する

Flow

OCR license plate flow diagram

ユーザーは、UI または API REST 呼び出しを通じて、車の画像を IBM Maximo Visual Inspection にアップロードします。
PowerAI モデルは画像内のオブジェクトを認識し、画像内のナンバープレートの位置を示します。
IBM Maximo Visual Inspection 後処理スクリプトは、トリミングされたナンバープレートの画像をカスタム OCR サーバーに送信します。
Python スクリプトは、次の方法でナンバープレートの画像を読み込みます。 opencv NumPy 配列として使用され、いくつかの処理アルゴリズムを使用してバックグラウンドノイズを除去し、プレートの数字を抽出します。
処理された画像には Tesseract OCR が使用されます。
ユーザーは、ターミナルログを通じてプレートテキストを含む JSON オブジェクトを受け取ります。

説明書

このパターンの詳細な手順については、 README ファイル。手順は、次の方法を示しています。

Kubernetes クラスターをデプロイします。
トレーニングイメージを IBM Maximo Visual Inspection にアップロードします。
IBM Maximo Visual Inspection でモデルをトレーニングしてデプロイします。
リポジトリのクローンを作成します。
OCRサーバーを導入します。

まとめ

このコードパターンでは、OCR と IBM Maximo Visual Inspection オブジェクト認識サービスを使用してナンバープレートを識別して読み取る方法を説明しました。コードパターンは、 IBM Maximo Visual Inspection の概要学習パス。おめでとう！これで、IBM Maximo Visual Inspection とその高度な機能のいくつかについて基本的に理解できたはずです。ただし、さらに詳しく知りたい場合は、以下を参照してください。 IBM Maximo Visual Inspection ページで見やすくするために変数を解析したりすることができます。

出典: https://developer.ibm.com/patterns/custom-inference-script-for-reading-license-plates-of-cars/

タイムスタンプ： 2020 年 6 月 16 日