Costruisci un modello di rilevamento degli oggetti per identificare le targhe delle immagini di automobili

Nodo di origine: 749910

Questo modello di codice fa parte di Iniziare con IBM Maximo Visual Inspection percorso di apprendimento.

Sommario

In questo modello di codice, scopri come utilizzare il riconoscimento ottico dei caratteri (OCR) e il servizio di riconoscimento degli oggetti IBM Maximo Visual Inspection per identificare e leggere le targhe.

Descrizione

Utilizzando IBM Maximo Visual Inspection e gli script di inferenza personalizzati, è possibile creare un modello di rilevamento degli oggetti per identificare le targhe dalle immagini delle automobili. I modelli nel servizio di riconoscimento oggetti IBM Maximo Visual Inspection possono identificare porzioni di immagini che rappresentano una targa. Quindi, lo script di inferenza post-personalizzato può ritagliare quest'area e utilizzare l'open source per eseguire l'OCR sul testo per restituire la targa. Questo caso d'uso è ideale per il controllo automatizzato degli accessi ai cancelli in aree quali luoghi di lavoro, complessi di appartamenti o parcheggi di centri commerciali.

Dopo aver completato questo modello di codice, capisci come:

  • Costruisci un modello di rilevamento degli oggetti
  • Attiva uno script di post-elaborazione quando vengono rilevati oggetti specifici
  • Usa Python Opencv librerie per preparare un'immagine per l'OCR
  • Regola Tesseract OCR per rilevare caratteri specifici

Flow

OCR license plate flow diagram

  1. L'utente carica un'immagine di un'auto su IBM Maximo Visual Inspection, tramite l'interfaccia utente o una chiamata API REST.
  2. Il modello PowerAI riconosce gli oggetti nell'immagine e indica dove si trova la targa nell'immagine.
  3. Lo script di post-elaborazione IBM Maximo Visual Inspection invia l'immagine della targa ritagliata al server OCR personalizzato.
  4. Uno script Python carica l'immagine della targa opencv come array NumPy e utilizza diversi algoritmi di elaborazione per rimuovere il rumore di fondo ed estrarre le cifre della piastra.
  5. Tesseract OCR viene utilizzato sull'immagine elaborata.
  6. L'utente riceve un oggetto JSON con il testo della targa tramite i log del terminale.

Istruzioni

Trova i passaggi dettagliati per questo modello nel readme file. I passaggi mostrano come:

  1. Distribuisci un cluster Kubernetes.
  2. Carica immagini di formazione su IBM Maximo Visual Inspection.
  3. Addestra e distribuisci un modello in IBM Maximo Visual Inspection.
  4. Clona il repository.
  5. Distribuire il server OCR.

Conclusione

Questo modello di codice spiega come utilizzare l'OCR e il servizio di riconoscimento degli oggetti IBM Maximo Visual Inspection per identificare e leggere le targhe. Il modello di codice è la parte finale del file Iniziare con IBM Maximo Visual Inspection percorso di apprendimento. Congratulazioni! Ora dovresti avere una conoscenza fondamentale di IBM Maximo Visual Inspection e di alcune delle sue funzionalità avanzate. Ma se vuoi saperne di più, dai un'occhiata al Ispezione visiva IBM Maximo .

Fonte: https://developer.ibm.com/patterns/custom-inference-script-for-reading-license-plates-of-cars/

Timestamp:

Di più da Sviluppatore IBM