Erstellen Sie ein Objekterkennungsmodell, um Nummernschilder anhand von Bildern von Autos zu identifizieren

Quellknoten: 749910

Dieses Codemuster ist Teil des Erste Schritte mit IBM Maximo Visual Inspection Lernweg.

Zusammenfassung

In diesem Codemuster erfahren Sie, wie Sie die optische Zeichenerkennung (OCR) und den Objekterkennungsdienst IBM Maximo Visual Inspection zum Identifizieren und Lesen von Nummernschildern verwenden.

Beschreibung

Mit IBM Maximo Visual Inspection und den benutzerdefinierten Inferenzskripten können Sie ein Objekterkennungsmodell erstellen, um Nummernschilder anhand von Bildern von Autos zu identifizieren. Die Modelle im IBM Maximo Visual Inspection-Objekterkennungsdienst können Teile von Bildern identifizieren, die ein Nummernschild darstellen. Anschließend kann das Post-Custom-Inferenzskript diesen Bereich zuschneiden und Open Source verwenden, um eine OCR für den Text durchzuführen, um das Nummernschild zurückzugeben. Dieser Anwendungsfall ist ideal für die automatisierte Zugangskontrolle von Toren in Bereichen wie Arbeitsplätzen, Apartmentkomplexen oder Parkplätzen in Einkaufszentren.

Wenn Sie dieses Codemuster abgeschlossen haben, wissen Sie, wie Sie:

  • Erstellen Sie ein Objekterkennungsmodell
  • Lösen Sie ein Nachbearbeitungsskript aus, wenn bestimmte Objekte erkannt werden
  • Verwenden Sie Python Opencv Bibliotheken, um ein Bild für OCR vorzubereiten
  • Passen Sie Tesseract OCR an, um bestimmte Schriftarten zu erkennen

Flow

OCR license plate flow diagram

  1. Der Benutzer lädt ein Bild eines Autos entweder über die Benutzeroberfläche oder einen API-REST-Aufruf auf IBM Maximo Visual Inspection hoch.
  2. Das PowerAI-Modell erkennt Objekte im Bild und zeigt an, wo sich das Nummernschild im Bild befindet.
  3. Das Nachbearbeitungsskript von IBM Maximo Visual Inspection sendet das zugeschnittene Nummernschildbild an den benutzerdefinierten OCR-Server.
  4. Ein Python-Skript lädt das Nummernschildbild durch opencv als NumPy-Array und verwendet mehrere Verarbeitungsalgorithmen, um Hintergrundrauschen zu entfernen und die Kennzeichenziffern zu extrahieren.
  5. Für das verarbeitete Bild wird Tesseract OCR verwendet.
  6. Der Benutzer erhält über Terminalprotokolle ein JSON-Objekt mit dem Schildtext.

Anweisungen

Die detaillierten Schritte für dieses Muster finden Sie in der readme Datei. Die Schritte zeigen Ihnen, wie Sie:

  1. Stellen Sie einen Kubernetes-Cluster bereit.
  2. Laden Sie Schulungsbilder in IBM Maximo Visual Inspection hoch.
  3. Trainieren und implementieren Sie ein Modell in IBM Maximo Visual Inspection.
  4. Klonen Sie das Repository.
  5. Stellen Sie den OCR-Server bereit.

Zusammenfassung

In diesem Codemuster wurde erläutert, wie OCR und der Objekterkennungsdienst IBM Maximo Visual Inspection zum Identifizieren und Lesen von Nummernschildern verwendet werden. Das Codemuster ist der letzte Teil des Erste Schritte mit IBM Maximo Visual Inspection Lernweg. Glückwunsch! Sie sollten nun über ein grundlegendes Verständnis von IBM Maximo Visual Inspection und einigen seiner erweiterten Funktionen verfügen. Aber wenn Sie mehr erfahren möchten, schauen Sie sich das an IBM Maximo Sichtprüfung

Quelle: https://developer.ibm.com/patterns/custom-inference-script-for-reading-license-plates-of-cars/

Zeitstempel:

Mehr von IBM Entwickler