Định vị và đếm các mục với tính năng phát hiện đối tượng

Nút nguồn: 749603

Mẫu mã này là một phần của Bắt đầu với Kiểm tra trực quan IBM Maximo con đường học tập.

Tổng kết

Phát hiện đối tượng có các cách sử dụng khác nhau và các cơ hội khác với phân loại hình ảnh. Mẫu mã này trình bày cách sử dụng Tính năng phát hiện đối tượng kiểm tra trực quan Maximo của IBM để phát hiện và gắn nhãn các đối tượng trong một hình ảnh (trong trường hợp này là các sản phẩm của Coca-Cola), dựa trên đào tạo tùy chỉnh. Sau đó, bạn có thể dễ dàng tùy chỉnh ví dụ về tập dữ liệu ban đầu này bằng các tập dữ liệu của riêng mình mà không cần viết bất kỳ mã nào.

Mô tả

Hãy tưởng tượng rằng bạn là nhà cung cấp một mặt hàng (chẳng hạn như nước ngọt) và bạn muốn biết có bao nhiêu chai trên kệ của cửa hàng. Bạn có thể xây dựng một ứng dụng giúp bạn làm điều đó. IBM Maximo Visual Inspection sử dụng deep learning để tạo các mô hình được đào tạo dựa trên hình ảnh mà bạn tải lên và gắn nhãn. Bạn không cần phải viết bất kỳ mã nào để đào tạo, triển khai và thử nghiệm mô hình phát hiện đối tượng mới. Bạn chỉ cần tải hình ảnh lên, sử dụng chuột để gắn nhãn cho các đối tượng trong hình ảnh của mình, sau đó để IBM Maximo Visual Inspection thực hiện việc học.

Với mẫu này, bạn sẽ sử dụng đào tạo học sâu để tạo mô hình phát hiện đối tượng. Chỉ với một vài cú nhấp chuột, bạn có thể đào tạo và triển khai mô hình. Sau khi bạn đào tạo và triển khai mô hình, điểm cuối REST cho phép bạn định vị và đếm các mục trong một hình ảnh. Mẫu mã bao gồm một bộ dữ liệu mẫu để giúp bạn xây dựng bộ phát hiện chai Coke nhưng bạn có thể sử dụng các mẫu của riêng mình và phát hiện các đối tượng khác.

IBM Maximo Visual Inspection trình bày các API REST cho các hoạt động suy luận. Bạn có thể sử dụng bất kỳ ứng dụng khách REST nào để phát hiện đối tượng với mô hình tùy chỉnh của mình và bạn có thể sử dụng Giao diện người dùng kiểm tra trực quan Maximo của IBM để kiểm tra nó. Ví dụ này bao gồm một ứng dụng Node.js mẫu minh họa cách tải lên một hình ảnh, sau đó vẽ hình ảnh đó bằng các nhãn và hộp giới hạn xung quanh các đối tượng được phát hiện.

Khi bạn đã hoàn thành mẫu mã này, bạn nên biết cách:

  • Tạo tập dữ liệu để phát hiện đối tượng với IBM Maximo Visual Inspection
  • Đào tạo và triển khai một mô hình dựa trên tập dữ liệu
  • Kiểm tra mô hình bằng các lệnh gọi REST

Dòng chảy

flow

  1. Tải hình ảnh lên để tạo bộ dữ liệu Kiểm tra trực quan IBM Maximo.
  2. Gắn nhãn các đối tượng trong tập dữ liệu hình ảnh trước khi đào tạo.
  3. Huấn luyện, triển khai và thử nghiệm mô hình trong IBM Maximo Visual Inspection.
  4. Sử dụng ứng dụng khách REST để phát hiện các đối tượng trong hình ảnh.

Hướng Dẫn

Tìm các bước chi tiết cho mẫu này trong README. Các bước đó sẽ chỉ cho bạn cách:

  1. Sao chép repo GitHub powerai-vision-object-detection.
  2. Đăng nhập vào IBM Maximo Visual Inspection.
  3. Tạo tập dữ liệu mới để đào tạo phát hiện đối tượng.
  4. Tạo thẻ cho các đối tượng đào tạo và gắn nhãn cho các đối tượng.
  5. Tạo một tác vụ DL.
  6. Triển khai và chạy thử mô hình.
  7. Chạy ứng dụng.

Kết luận

Mẫu mã này trình bày cách sử dụng Tính năng Phát hiện Đối tượng Kiểm tra Trực quan Maximo của IBM để phát hiện và gắn nhãn các đối tượng trong một hình ảnh dựa trên đào tạo tùy chỉnh. Mẫu mã là một phần của Bắt đầu với Kiểm tra trực quan IBM Maximo con đường học tập. Để tiếp tục loạt bài này và tìm hiểu thêm về các tính năng Kiểm tra trực quan Maximo của IBM, hãy xem mẫu mã tiếp theo, Theo dõi đối tượng trong video với OpenCV và Deep Learning.

Nguồn: https://developer.ibm.com/patterns/locate-and-count-items-with-object-detection/

Dấu thời gian:

Thêm từ Nhà phát triển IBM