Byg en objektdetekteringsmodel til at identificere nummerplader fra billeder af biler

Kildeknude: 749910

Dette kodemønster er en del af Kom godt i gang med IBM Maximo Visual Inspection læringsvej.

Resumé

I dette kodemønster kan du lære, hvordan du bruger optisk tegngenkendelse (OCR) og IBM Maximo Visual Inspection-objektgenkendelsestjenesten til at identificere og læse nummerplader.

Beskrivelse

Ved at bruge IBM Maximo Visual Inspection og Custom Inference Scripts kan du bygge en objektdetekteringsmodel til at identificere nummerplader fra billeder af biler. Modellerne i IBM Maximo Visual Inspection objektgenkendelsestjenesten kan identificere dele af billeder, der repræsenterer en nummerplade. Derefter kan det tilpassede inferensscript beskære dette område og bruge open source til at udføre OCR på teksten for at returnere nummerpladen. Denne use case er ideel til automatiseret gate adgangskontrol i områder som arbejdspladser, lejlighedskomplekser eller indkøbscenter parkeringspladser.

Når du har gennemført dette kodemønster, forstår du, hvordan du:

  • Byg en objektdetekteringsmodel
  • Udløs et efterbehandlingsscript, når specifikke objekter detekteres
  • Brug Python Opencv biblioteker til at forberede et billede til OCR
  • Juster Tesseract OCR for at finde bestemte skrifttyper

Flow

OCR license plate flow diagram

  1. Brugeren uploader et billede af en bil til IBM Maximo Visual Inspection, enten via brugergrænsefladen eller et API REST-kald.
  2. PowerAI-modellen genkender objekter på billedet og angiver, hvor nummerpladen er placeret på billedet.
  3. IBM Maximo Visual Inspection-efterbehandlingsscriptet sender det beskårne nummerpladebillede til den tilpassede OCR-server.
  4. Et Python-script indlæser nummerpladebilledet igennem opencv som et NumPy-array og bruger flere behandlingsalgoritmer til at fjerne baggrundsstøj og udtrække pladecifrene.
  5. Tesseract OCR bruges på det behandlede billede.
  6. Brugeren modtager et JSON-objekt med pladeteksten gennem terminallogs.

Instruktioner

Find de detaljerede trin til dette mønster i readme fil. Trinene viser dig, hvordan du:

  1. Implementer en Kubernetes-klynge.
  2. Upload træningsbilleder til IBM Maximo Visual Inspection.
  3. Træn og implementer en model i IBM Maximo Visual Inspection.
  4. Klon depotet.
  5. Implementer OCR-serveren.

Konklusion

Dette kodemønster forklarede, hvordan man bruger OCR og IBM Maximo Visual Inspection-objektgenkendelsestjenesten til at identificere og læse nummerplader. Kodemønsteret er den sidste del af Kom godt i gang med IBM Maximo Visual Inspection læringsvej. Tillykke! Du bør nu have en grundlæggende forståelse af IBM Maximo Visual Inspection og nogle af dets avancerede funktioner. Men hvis du vil vide mere, så tag et kig på IBM Maximo Visual Inspection .

Kilde: https://developer.ibm.com/patterns/custom-inference-script-for-reading-license-plates-of-cars/

Tidsstempel:

Mere fra IBM-udvikler