Bygg en objektdeteksjonsmodell for å identifisere skilt fra bilder av biler

Kilde node: 749910

Dette kodemønsteret er en del av Komme i gang med IBM Maximo Visual Inspection læringsvei.

Oppsummering

I dette kodemønsteret lærer du hvordan du bruker optisk tegngjenkjenning (OCR) og IBM Maximo Visual Inspection objektgjenkjenningstjeneste for å identifisere og lese lisensskilt.

Beskrivelse

Ved å bruke IBM Maximo Visual Inspection og Custom Inference Scripts kan du bygge en objektdeteksjonsmodell for å identifisere skilt fra bilder av biler. Modellene i IBM Maximo Visual Inspection-objektgjenkjenningstjenesten kan identifisere deler av bilder som representerer et lisensskilt. Deretter kan det tilpassede slutningsskriptet beskjære dette området og bruke åpen kildekode for å utføre OCR på teksten for å returnere lisensplaten. Denne bruksboksen er ideell for automatisert gatetilgangskontroll i områder som arbeidsplasser, leilighetskomplekser eller kjøpesentre.

Når du har fullført dette kodemønsteret, forstår du hvordan du:

  • Bygg en objektdeteksjonsmodell
  • Utløs et etterbehandlingsskript når spesifikke objekter oppdages
  • Bruk Python Opencv biblioteker for å forberede et bilde for OCR
  • Juster Tesseract OCR for å oppdage spesifikke skrifter

Flow

OCR license plate flow diagram

  1. Brukeren laster opp et bilde av en bil til IBM Maximo Visual Inspection, enten gjennom brukergrensesnittet eller et API REST-kall.
  2. PowerAI-modellen gjenkjenner objekter i bildet og indikerer hvor bilskiltet er plassert i bildet.
  3. IBM Maximo Visual Inspection-etterbehandlingsskriptet sender det beskårede lisensplatebildet til den tilpassede OCR-serveren.
  4. Et Python-skript laster skiltbildet gjennom opencv som en NumPy-matrise og bruker flere behandlingsalgoritmer for å fjerne bakgrunnsstøy og trekke ut tallerkensifrene.
  5. Tesseract OCR brukes på det behandlede bildet.
  6. Brukeren mottar et JSON-objekt med plateteksten gjennom terminallogger.

Instruksjoner

Finn de detaljerte trinnene for dette mønsteret i readme fil. Trinnene viser deg hvordan du gjør:

  1. Distribuer en Kubernetes-klynge.
  2. Last opp opplæringsbilder til IBM Maximo Visual Inspection.
  3. Tren og distribuer en modell i IBM Maximo Visual Inspection.
  4. Klone depotet.
  5. Distribuer OCR-serveren.

konklusjonen

Dette kodemønsteret forklarte hvordan du bruker OCR og IBM Maximo Visual Inspection-objektgjenkjenningstjenesten for å identifisere og lese lisensskilt. Kodemønsteret er den siste delen av Komme i gang med IBM Maximo Visual Inspection læringsvei. Gratulerer! Du bør nå ha en grunnleggende forståelse av IBM Maximo Visual Inspection og noen av dens avanserte funksjoner. Men hvis du vil lære mer, ta en titt på IBM Maximo Visual Inspection side.

Kilde: https://developer.ibm.com/patterns/custom-inference-script-for-reading-license-plates-of-cars/

Tidstempel:

Mer fra IBM-utvikler