Dette kodemønsteret er en del av Komme i gang med IBM Maximo Visual Inspection læringsvei.
Oppsummering
I dette kodemønsteret lærer du hvordan du bruker optisk tegngjenkjenning (OCR) og IBM Maximo Visual Inspection objektgjenkjenningstjeneste for å identifisere og lese lisensskilt.
Beskrivelse
Ved å bruke IBM Maximo Visual Inspection og Custom Inference Scripts kan du bygge en objektdeteksjonsmodell for å identifisere skilt fra bilder av biler. Modellene i IBM Maximo Visual Inspection-objektgjenkjenningstjenesten kan identifisere deler av bilder som representerer et lisensskilt. Deretter kan det tilpassede slutningsskriptet beskjære dette området og bruke åpen kildekode for å utføre OCR på teksten for å returnere lisensplaten. Denne bruksboksen er ideell for automatisert gatetilgangskontroll i områder som arbeidsplasser, leilighetskomplekser eller kjøpesentre.
Når du har fullført dette kodemønsteret, forstår du hvordan du:
- Bygg en objektdeteksjonsmodell
- Utløs et etterbehandlingsskript når spesifikke objekter oppdages
- Bruk Python
Opencv
biblioteker for å forberede et bilde for OCR - Juster Tesseract OCR for å oppdage spesifikke skrifter
Flow
- Brukeren laster opp et bilde av en bil til IBM Maximo Visual Inspection, enten gjennom brukergrensesnittet eller et API REST-kall.
- PowerAI-modellen gjenkjenner objekter i bildet og indikerer hvor bilskiltet er plassert i bildet.
- IBM Maximo Visual Inspection-etterbehandlingsskriptet sender det beskårede lisensplatebildet til den tilpassede OCR-serveren.
- Et Python-skript laster skiltbildet gjennom
opencv
som en NumPy-matrise og bruker flere behandlingsalgoritmer for å fjerne bakgrunnsstøy og trekke ut tallerkensifrene. - Tesseract OCR brukes på det behandlede bildet.
- Brukeren mottar et JSON-objekt med plateteksten gjennom terminallogger.
Instruksjoner
Finn de detaljerte trinnene for dette mønsteret i readme fil. Trinnene viser deg hvordan du gjør:
- Distribuer en Kubernetes-klynge.
- Last opp opplæringsbilder til IBM Maximo Visual Inspection.
- Tren og distribuer en modell i IBM Maximo Visual Inspection.
- Klone depotet.
- Distribuer OCR-serveren.
konklusjonen
Dette kodemønsteret forklarte hvordan du bruker OCR og IBM Maximo Visual Inspection-objektgjenkjenningstjenesten for å identifisere og lese lisensskilt. Kodemønsteret er den siste delen av Komme i gang med IBM Maximo Visual Inspection læringsvei. Gratulerer! Du bør nå ha en grunnleggende forståelse av IBM Maximo Visual Inspection og noen av dens avanserte funksjoner. Men hvis du vil lære mer, ta en titt på IBM Maximo Visual Inspection side.
- adgang
- algoritmer
- api
- AREA
- Automatisert
- kroppen
- bygge
- ring
- bil
- biler
- karaktergjenkjenning
- kode
- innhold
- avling
- Gjenkjenning
- sifre
- Egenskaper
- flyten
- Hvordan
- Hvordan
- HTTPS
- IBM
- identifisere
- bilde
- Kubernetes
- LÆRE
- læring
- Tillatelse
- modell
- Bråk
- Objektdeteksjon
- OCR
- åpen
- åpen kildekode
- Optisk karaktergjenkjennelse
- parkering
- Mønster
- Python
- REST
- startet
- Tesseract
- Kurs
- ui