Побудуйте модель виявлення об’єктів для ідентифікації номерних знаків із зображень автомобілів

Вихідний вузол: 749910

Цей шаблон коду є частиною Початок роботи з IBM Maximo Visual Inspection навчальний шлях.

Підсумки

У цьому шаблоні коду дізнайтеся, як використовувати оптичне розпізнавання символів (OCR) і службу розпізнавання об’єктів IBM Maximo Visual Inspection для ідентифікації та читання номерних знаків.

Опис

Використовуючи IBM Maximo Visual Inspection і Custom Inference Scripts, ви можете створити модель виявлення об’єктів для ідентифікації номерних знаків із зображень автомобілів. Моделі в службі розпізнавання об’єктів IBM Maximo Visual Inspection можуть ідентифікувати частини зображень, які представляють номерний знак. Потім сценарій настроюваного висновку після публікації може обрізати цю область і використовувати відкритий вихідний код для розпізнавання тексту, щоб повернути номерний знак. Цей варіант використання ідеально підходить для автоматизованого контролю доступу до воріт у таких місцях, як робочі місця, житлові комплекси чи стоянки торгових центрів.

Виконавши цей шаблон коду, ви зрозумієте, як:

  • Побудувати модель виявлення об’єкта
  • Запускати сценарій постобробки при виявленні певних об’єктів
  • Використовуйте Python Opencv бібліотеки для підготовки зображення для OCR
  • Налаштуйте Tesseract OCR для визначення певних шрифтів

Потік

OCR license plate flow diagram

  1. Користувач завантажує зображення автомобіля до IBM Maximo Visual Inspection через інтерфейс користувача або виклик REST API.
  2. Модель PowerAI розпізнає об’єкти на зображенні та вказує, де на зображенні розташований номерний знак.
  3. Сценарій постобробки IBM Maximo Visual Inspection надсилає обрізане зображення номерного знака на спеціальний сервер OCR.
  4. Сценарій Python завантажує зображення номерного знака opencv як масив NumPy і використовує кілька алгоритмів обробки для видалення фонового шуму та вилучення цифр номерного знака.
  5. Tesseract OCR використовується для обробленого зображення.
  6. Користувач отримує об’єкт JSON із текстом таблички через журнали терміналу.

інструкції

Знайдіть докладні кроки для цього шаблону в ридми файл. Ці кроки показують, як:

  1. Розгорніть кластер Kubernetes.
  2. Завантажте навчальні зображення до IBM Maximo Visual Inspection.
  3. Навчіть і розгорніть модель у IBM Maximo Visual Inspection.
  4. Клонувати сховище.
  5. Розгорніть OCR-сервер.

Висновок

Цей шаблон коду пояснював, як використовувати OCR і службу розпізнавання об’єктів IBM Maximo Visual Inspection для ідентифікації та зчитування номерних знаків. Шаблон коду є заключною частиною Початок роботи з IBM Maximo Visual Inspection шлях навчання. Щиро вітаю! Тепер ви повинні мати фундаментальне розуміння IBM Maximo Visual Inspection і деяких його розширених функцій. Але, якщо ви хочете дізнатися більше, подивіться на Візуальний огляд IBM Maximo стр.

Джерело: https://developer.ibm.com/patterns/custom-inference-script-for-reading-license-plates-of-cars/

Часова мітка:

Більше від Розробник IBM