Xây dựng mô hình phát hiện đối tượng để xác định biển số xe từ hình ảnh ô tô

Được xuất bản lại bởi Plato

Người theo dõi: 0

Mẫu mã này là một phần của Bắt đầu với Kiểm tra trực quan IBM Maximo con đường học tập.

Tổng kết

Trong mẫu mã này, hãy tìm hiểu cách sử dụng tính năng nhận dạng ký tự quang học (OCR) và dịch vụ nhận dạng đối tượng IBM Maximo Visual Inspection để nhận dạng và đọc biển số xe.

Mô tả

Sử dụng IBM Maximo Visual Inspection và Custom Inference Scripts, bạn có thể xây dựng mô hình phát hiện đối tượng để nhận dạng biển số xe từ hình ảnh ô tô. Các mô hình trong dịch vụ nhận dạng đối tượng Kiểm tra trực quan IBM Maximo có thể xác định các phần của hình ảnh đại diện cho biển số xe. Sau đó, tập lệnh suy luận tùy chỉnh bài đăng có thể cắt vùng này và sử dụng nguồn mở để thực hiện OCR trên văn bản để trả về biển số xe. Trường hợp sử dụng này là lý tưởng để kiểm soát truy cập cổng tự động trong các khu vực như nơi làm việc, khu chung cư hoặc bãi đậu xe của trung tâm thương mại.

Khi bạn đã hoàn thành mẫu mã này, bạn hiểu cách:

Xây dựng mô hình phát hiện đối tượng
Kích hoạt tập lệnh xử lý hậu kỳ khi các đối tượng cụ thể được phát hiện
Sử dụng Python Opencv thư viện để chuẩn bị hình ảnh cho OCR
Điều chỉnh Tesseract OCR để phát hiện các phông chữ cụ thể

Dòng chảy

OCR license plate flow diagram

Người dùng tải hình ảnh ô tô lên IBM Maximo Visual Inspection, thông qua giao diện người dùng hoặc lệnh gọi API REST.
Mô hình PowerAI nhận dạng các đối tượng trong hình ảnh và cho biết vị trí đặt biển số xe trong hình ảnh.
Tập lệnh hậu xử lý IBM Maximo Visual Inspection sẽ gửi hình ảnh biển số xe đã cắt tới máy chủ OCR tùy chỉnh.
Một tập lệnh Python tải hình ảnh biển số thông qua opencv như một mảng NumPy và sử dụng một số thuật toán xử lý để loại bỏ tiếng ồn xung quanh và trích xuất các chữ số của tấm.
Tesseract OCR được sử dụng trên hình ảnh đã xử lý.
Người dùng nhận được một đối tượng JSON với văn bản tấm thông qua các bản ghi đầu cuối.

Hướng Dẫn

Tìm các bước chi tiết cho mẫu này trong readme tập tin. Các bước hướng dẫn bạn cách:

Triển khai một cụm Kubernetes.
Tải hình ảnh đào tạo lên IBM Maximo Visual Inspection.
Huấn luyện và triển khai một mô hình trong IBM Maximo Visual Inspection.
Sao chép kho lưu trữ.
Triển khai máy chủ OCR.

Kết luận

Mẫu mã này giải thích cách sử dụng OCR và dịch vụ nhận dạng đối tượng IBM Maximo Visual Inspection để xác định và đọc biển số xe. Mẫu mã là phần cuối cùng của Bắt đầu với Kiểm tra trực quan IBM Maximo con đường học tập. Chúc mừng! Giờ đây, bạn đã có hiểu biết cơ bản về Kiểm tra trực quan Maximo của IBM và một số tính năng nâng cao của nó. Tuy nhiên, nếu bạn muốn tìm hiểu thêm, hãy xem Kiểm tra bằng hình ảnh Maximo của IBM .

Nguồn: https://developer.ibm.com/patterns/custom-inference-script-for-reading-license-plates-of-cars/

Dấu thời gian: 16 Tháng Sáu, 2020