Bygg en objektdetekteringsmodell för att identifiera registreringsskyltar från bilder av bilar

Källnod: 749910

Detta kodmönster är en del av Komma igång med IBM Maximo Visual Inspection inlärningsväg.

Sammanfattning

I det här kodmönster kan du lära dig hur du använder optisk teckenigenkänning (OCR) och IBM Maximo Visual Inspections objektigenkänningstjänst för att identifiera och läsa registreringsskyltar.

Beskrivning

Med hjälp av IBM Maximo Visual Inspection och Custom Inference Scripts kan du bygga en objektdetekteringsmodell för att identifiera registreringsskyltar från bilder av bilar. Modellerna i IBM Maximo Visual Inspection objektigenkänningstjänst kan identifiera delar av bilder som representerar en registreringsskylt. Sedan kan det anpassade slutledningsskriptet beskära detta område och använda öppen källkod för att utföra OCR på texten för att returnera registreringsskylten. Detta användningsfall är idealiskt för automatiserad grindtillträdeskontroll i områden som arbetsplatser, lägenhetskomplex eller gallerior parkeringsplatser.

När du har slutfört detta kodmönster förstår du hur du:

  • Bygg en objektdetekteringsmodell
  • Utlösa ett efterbearbetningsskript när specifika objekt upptäcks
  • Använd Python Opencv bibliotek för att förbereda en bild för OCR
  • Justera Tesseract OCR för att upptäcka specifika teckensnitt

Flöde

OCR license plate flow diagram

  1. Användaren laddar upp en bild av en bil till IBM Maximo Visual Inspection, antingen via UI eller ett API REST-anrop.
  2. PowerAI-modellen känner igen objekt i bilden och anger var registreringsskylten finns i bilden.
  3. Efterbehandlingsskriptet IBM Maximo Visual Inspection skickar den beskurna registreringsskyltbilden till den anpassade OCR-servern.
  4. Ett Python-skript laddar registreringsskyltbilden igenom opencv som en NumPy-array och använder flera bearbetningsalgoritmer för att ta bort bakgrundsbrus och extrahera plattans siffror.
  5. Tesseract OCR används på den bearbetade bilden.
  6. Användaren får ett JSON-objekt med platttexten via terminalloggar.

Instruktioner

Hitta de detaljerade stegen för detta mönster i readme fil. Stegen visar hur du gör:

  1. Distribuera ett Kubernetes-kluster.
  2. Ladda upp träningsbilder till IBM Maximo Visual Inspection.
  3. Träna och distribuera en modell i IBM Maximo Visual Inspection.
  4. Klona förvaret.
  5. Distribuera OCR-servern.

Slutsats

Detta kodmönster förklarade hur man använder OCR och IBM Maximo Visual Inspection objektigenkänningstjänst för att identifiera och läsa registreringsskyltar. Kodmönstret är den sista delen av Komma igång med IBM Maximo Visual Inspection inlärningsväg. Grattis! Du bör nu ha en grundläggande förståelse för IBM Maximo Visual Inspection och några av dess avancerade funktioner. Men om du vill lära dig mer, ta en titt på IBM Maximo Visual Inspection sida.

Källa: https://developer.ibm.com/patterns/custom-inference-script-for-reading-license-plates-of-cars/

Tidsstämpel:

Mer från IBM-utvecklare