Ten wzorzec kodu jest częścią Pierwsze kroki z IBM Maximo Visual Inspection ścieżka nauczania.
Podsumowanie
W tym wzorcu kodu dowiesz się, jak używać optycznego rozpoznawania znaków (OCR) i usługi rozpoznawania obiektów IBM Maximo Visual Inspection do identyfikowania i odczytywania tablic rejestracyjnych.
Opis
Korzystając z programu IBM Maximo Visual Inspection i niestandardowych skryptów wnioskowania, można zbudować model wykrywania obiektów w celu identyfikacji tablic rejestracyjnych na podstawie obrazów samochodów. Modele w usłudze rozpoznawania obiektów IBM Maximo Visual Inspection potrafią identyfikować fragmenty obrazów reprezentujące tablice rejestracyjne. Następnie skrypt wnioskowania niestandardowego może przyciąć ten obszar i użyć oprogramowania open source do wykonania OCR tekstu w celu zwrócenia tablicy rejestracyjnej. Ten przypadek użycia idealnie nadaje się do automatycznej kontroli dostępu do bram w obszarach takich jak miejsca pracy, kompleksy mieszkalne lub parkingi w centrach handlowych.
Po zakończeniu tego wzorca kodu zrozumiesz, jak:
- Zbuduj model wykrywania obiektów
- Uruchamiaj skrypt przetwarzania końcowego po wykryciu określonych obiektów
- Użyj Pythona
Opencv
bibliotek do przygotowania obrazu do OCR - Dostosuj Tesseract OCR do wykrywania określonych czcionek
Przepływ
- Użytkownik przesyła obraz samochodu do programu IBM Maximo Visual Inspection za pośrednictwem interfejsu użytkownika lub wywołania API REST.
- Model PowerAI rozpoznaje obiekty na obrazie i wskazuje, gdzie na obrazie znajduje się tablica rejestracyjna.
- Skrypt przetwarzania końcowego IBM Maximo Visual Inspection wysyła przycięty obraz tablicy rejestracyjnej do niestandardowego serwera OCR.
- Skrypt Pythona ładuje obraz tablicy rejestracyjnej
opencv
jako tablicę NumPy i wykorzystuje kilka algorytmów przetwarzania w celu usunięcia szumu tła i wyodrębnienia cyfr z płyty. - Na przetworzonym obrazie stosowany jest Tesseract OCR.
- Użytkownik otrzymuje obiekt JSON z tekstem tablicy poprzez logi terminala.
Instrukcje
Znajdź szczegółowe kroki dla tego wzoru w readme plik. Kroki pokazują, jak:
- Wdróż klaster Kubernetes.
- Przesyłaj obrazy szkoleniowe do programu IBM Maximo Visual Inspection.
- Trenuj i wdrażaj model w IBM Maximo Visual Inspection.
- Sklonuj repozytorium.
- Wdróż serwer OCR.
Wnioski
Ten wzorzec kodu wyjaśnia, jak używać OCR i usługi rozpoznawania obiektów IBM Maximo Visual Inspection do identyfikowania i odczytywania tablic rejestracyjnych. Wzorzec kodu jest ostatnią częścią pliku Pierwsze kroki z IBM Maximo Visual Inspection ścieżka nauczania. Gratulacje! Powinieneś teraz posiadać podstawową wiedzę na temat programu IBM Maximo Visual Inspection i niektórych jego zaawansowanych funkcji. Jeśli jednak chcesz dowiedzieć się więcej, zajrzyj do Inspekcja wizualna IBM Maximo strona.
- dostęp
- Algorytmy
- api
- POWIERZCHNIA
- zautomatyzowane
- ciało
- budować
- wezwanie
- wózek
- samochody
- rozpoznawanie znaków
- kod
- zawartość
- wole
- Wykrywanie
- cyfry
- Korzyści
- pływ
- W jaki sposób
- How To
- HTTPS
- IBM
- zidentyfikować
- obraz
- Kubernetes
- UCZYĆ SIĘ
- nauka
- Licencja
- model
- Hałas
- Wykrywanie obiektów
- OCR
- koncepcja
- open source
- optyczne rozpoznawanie znaków
- parking
- Wzór
- Python
- REST
- rozpoczęty
- tesseract
- Trening
- ui