Zbuduj model wykrywania obiektów w celu identyfikacji tablic rejestracyjnych na podstawie zdjęć samochodów

Węzeł źródłowy: 749910

Ten wzorzec kodu jest częścią Pierwsze kroki z IBM Maximo Visual Inspection ścieżka nauczania.

Podsumowanie

W tym wzorcu kodu dowiesz się, jak używać optycznego rozpoznawania znaków (OCR) i usługi rozpoznawania obiektów IBM Maximo Visual Inspection do identyfikowania i odczytywania tablic rejestracyjnych.

Opis

Korzystając z programu IBM Maximo Visual Inspection i niestandardowych skryptów wnioskowania, można zbudować model wykrywania obiektów w celu identyfikacji tablic rejestracyjnych na podstawie obrazów samochodów. Modele w usłudze rozpoznawania obiektów IBM Maximo Visual Inspection potrafią identyfikować fragmenty obrazów reprezentujące tablice rejestracyjne. Następnie skrypt wnioskowania niestandardowego może przyciąć ten obszar i użyć oprogramowania open source do wykonania OCR tekstu w celu zwrócenia tablicy rejestracyjnej. Ten przypadek użycia idealnie nadaje się do automatycznej kontroli dostępu do bram w obszarach takich jak miejsca pracy, kompleksy mieszkalne lub parkingi w centrach handlowych.

Po zakończeniu tego wzorca kodu zrozumiesz, jak:

  • Zbuduj model wykrywania obiektów
  • Uruchamiaj skrypt przetwarzania końcowego po wykryciu określonych obiektów
  • Użyj Pythona Opencv bibliotek do przygotowania obrazu do OCR
  • Dostosuj Tesseract OCR do wykrywania określonych czcionek

Przepływ

OCR license plate flow diagram

  1. Użytkownik przesyła obraz samochodu do programu IBM Maximo Visual Inspection za pośrednictwem interfejsu użytkownika lub wywołania API REST.
  2. Model PowerAI rozpoznaje obiekty na obrazie i wskazuje, gdzie na obrazie znajduje się tablica rejestracyjna.
  3. Skrypt przetwarzania końcowego IBM Maximo Visual Inspection wysyła przycięty obraz tablicy rejestracyjnej do niestandardowego serwera OCR.
  4. Skrypt Pythona ładuje obraz tablicy rejestracyjnej opencv jako tablicę NumPy i wykorzystuje kilka algorytmów przetwarzania w celu usunięcia szumu tła i wyodrębnienia cyfr z płyty.
  5. Na przetworzonym obrazie stosowany jest Tesseract OCR.
  6. Użytkownik otrzymuje obiekt JSON z tekstem tablicy poprzez logi terminala.

Instrukcje

Znajdź szczegółowe kroki dla tego wzoru w readme plik. Kroki pokazują, jak:

  1. Wdróż klaster Kubernetes.
  2. Przesyłaj obrazy szkoleniowe do programu IBM Maximo Visual Inspection.
  3. Trenuj i wdrażaj model w IBM Maximo Visual Inspection.
  4. Sklonuj repozytorium.
  5. Wdróż serwer OCR.

Wnioski

Ten wzorzec kodu wyjaśnia, jak używać OCR i usługi rozpoznawania obiektów IBM Maximo Visual Inspection do identyfikowania i odczytywania tablic rejestracyjnych. Wzorzec kodu jest ostatnią częścią pliku Pierwsze kroki z IBM Maximo Visual Inspection ścieżka nauczania. Gratulacje! Powinieneś teraz posiadać podstawową wiedzę na temat programu IBM Maximo Visual Inspection i niektórych jego zaawansowanych funkcji. Jeśli jednak chcesz dowiedzieć się więcej, zajrzyj do Inspekcja wizualna IBM Maximo strona.

Źródło: https://developer.ibm.com/patterns/custom-inference-script-for-reading-license-plates-of-cars/

Znak czasu:

Więcej z Programista IBM