Построить модель обнаружения объекта для идентификации номерных знаков по изображениям автомобилей.

Исходный узел: 749910

Этот шаблон кода является частью Начало работы с IBM Maximo Visual Inspection путь обучения.

Обзор

В этом шаблоне кода вы узнаете, как использовать оптическое распознавание символов (OCR) и службу распознавания объектов IBM Maximo Visual Inspection для идентификации и считывания номерных знаков.

Описание

Используя IBM Maximo Visual Inspection и пользовательские сценарии вывода, вы можете построить модель обнаружения объектов, чтобы идентифицировать номерные знаки на изображениях автомобилей. Модели в службе распознавания объектов IBM Maximo Visual Inspection могут идентифицировать части изображений, которые представляют номерной знак. Затем сценарий пользовательского логического вывода может обрезать эту область и использовать открытый исходный код для выполнения распознавания текста, чтобы вернуть номерной знак. Этот вариант использования идеально подходит для автоматизированного контроля доступа к воротам в таких областях, как рабочие места, жилые комплексы или парковки торговых центров.

Когда вы завершили этот шаблон кода, вы понимаете, как:

  • Построить модель обнаружения объекта
  • Запуск сценария постобработки при обнаружении определенных объектов
  • Используйте Python Opencv библиотеки для подготовки изображения для распознавания текста
  • Настройте Tesseract OCR для обнаружения определенных шрифтов.

Поток

OCR license plate flow diagram

  1. Пользователь загружает изображение автомобиля в IBM Maximo Visual Inspection либо через пользовательский интерфейс, либо через вызов API REST.
  2. Модель PowerAI распознает объекты на изображении и указывает, где находится номерной знак на изображении.
  3. Сценарий постобработки IBM Maximo Visual Inspection отправляет обрезанное изображение номерного знака на пользовательский сервер OCR.
  4. Скрипт Python загружает изображение номерного знака через opencv как массив NumPy и использует несколько алгоритмов обработки, чтобы удалить фоновый шум и извлечь цифры пластины.
  5. Тессеракт OCR используется на обработанном изображении.
  6. Пользователь получает объект JSON с текстом пластины через журналы терминала.

инструкции

Найти подробные шаги для этого шаблона в ридми файл. Шаги показывают вам, как:

  1. Разверните кластер Kubernetes.
  2. Загрузите обучающие изображения в IBM Maximo Visual Inspection.
  3. Обучите и разверните модель в IBM Maximo Visual Inspection.
  4. Клонировать хранилище.
  5. Разверните сервер OCR.

Заключение

В этом шаблоне кода объясняется, как использовать OCR и службу распознавания объектов IBM Maximo Visual Inspection для идентификации и считывания номерных знаков. Шаблон кода является последней частью Начало работы с IBM Maximo Visual Inspection путь обучения. Поздравляем! Теперь у вас должно быть общее представление о IBM Maximo Visual Inspection и некоторых его дополнительных функциях. Но если вы хотите узнать больше, взгляните на Визуальный осмотр IBM Maximo стр.

Источник: https://developer.ibm.com/patterns/custom-inference-script-for-reading-license-plates-of-cars/

Отметка времени:

Больше от Разработчик IBM