Cree un modelo de detección de objetos para identificar las matrículas de las imágenes de los automóviles.

Nodo de origen: 749910

Este patrón de código es parte del Introducción a IBM Maximo Visual Inspection camino de aprendizaje.

Resumen

En este patrón de código, aprenda a utilizar el reconocimiento óptico de caracteres (OCR) y el servicio de reconocimiento de objetos IBM Maximo Visual Inspection para identificar y leer matrículas.

Descripción

Utilizando IBM Maximo Visual Inspection y los scripts de inferencia personalizados, puede crear un modelo de detección de objetos para identificar matrículas a partir de imágenes de automóviles. Los modelos del servicio de reconocimiento de objetos IBM Maximo Visual Inspection pueden identificar partes de imágenes que representan una matrícula. Luego, el script de inferencia personalizado posterior puede recortar esta área y usar código abierto para realizar OCR en el texto para devolver la matrícula. Este caso de uso es ideal para el control de acceso automatizado a puertas en áreas como lugares de trabajo, complejos de apartamentos o estacionamientos de centros comerciales.

Cuando haya completado este patrón de código, comprenderá cómo:

  • Construir un modelo de detección de objetos
  • Activar un script de posprocesamiento cuando se detectan objetos específicos
  • Usar Python Opencv bibliotecas para preparar una imagen para OCR
  • Ajuste Tesseract OCR para detectar fuentes específicas

Flujo

OCR license plate flow diagram

  1. El usuario carga una imagen de un automóvil en IBM Maximo Visual Inspection, ya sea a través de la interfaz de usuario o de una llamada API REST.
  2. El modelo PowerAI reconoce objetos en la imagen e indica dónde se encuentra la matrícula en la imagen.
  3. El script de posprocesamiento de IBM Maximo Visual Inspection envía la imagen de la matrícula recortada al servidor de OCR personalizado.
  4. Un script de Python carga la imagen de la matrícula a través de opencv como una matriz NumPy y utiliza varios algoritmos de procesamiento para eliminar el ruido de fondo y extraer los dígitos de la placa.
  5. Tesseract OCR se utiliza en la imagen procesada.
  6. El usuario recibe un objeto JSON con el texto de la placa a través de los registros del terminal.

Instrucciones

Encuentre los pasos detallados para este patrón en el readme archivo. Los pasos le muestran cómo:

  1. Implemente un clúster de Kubernetes.
  2. Cargue imágenes de formación en IBM Maximo Visual Inspection.
  3. Entrene e implemente un modelo en IBM Maximo Visual Inspection.
  4. Clonar el repositorio.
  5. Implemente el servidor OCR.

Conclusión

Este patrón de código explica cómo utilizar OCR y el servicio de reconocimiento de objetos IBM Maximo Visual Inspection para identificar y leer matrículas. El patrón de código es la parte final del Introducción a IBM Maximo Visual Inspection ruta de aprendizaje. ¡Felicidades! Ahora debería tener un conocimiento fundamental de IBM Maximo Visual Inspection y algunas de sus funciones avanzadas. Pero si quieres saber más, echa un vistazo a Inspección visual de IBM Maximo .

Fuente: https://developer.ibm.com/patterns/custom-inference-script-for-reading-license-plates-of-cars/

Sello de tiempo:

Mas de Desarrollador de IBM