Xây dựng mô hình phân loại hình ảnh

Nút nguồn: 748605

Tổng kết

Mẫu mã này giải thích cách phân loại bảng chữ cái Ngôn ngữ ký hiệu Hoa Kỳ (ASL) bằng cách sử dụng PyTorch và mạng học sâu. Nó sử dụng một mô hình được đào tạo trước từ vườn thú mô hình PyTorch và đào tạo lại phần cuối cùng của mạng.

Mô tả

Mẫu mã sử dụng PyTorch để xây dựng và đào tạo mô hình học sâu để phân loại hình ảnh thành 29 lớp (26 bảng chữ cái ASL, dấu cách, Del và không có gì), có thể được sử dụng sau này để giúp những người khiếm thính giao tiếp với người khác như với máy tính. Mẫu sử dụng mạng di động được định nghĩa trước, xác định bộ phân loại và kết nối nó với mạng. Sau đó, nó đào tạo bộ phân loại này cùng với một số khối cuối cùng của mạng trên tập dữ liệu. Mẫu sử dụng môi trường Python và GPU trong IBM® Watson ™ Studio để đào tạo nhanh hơn, cho phép bạn tải xuống, khám phá, xây dựng và đào tạo mô hình của mình. Học nhiều hơn về môi trường Watson Studio có sẵn.

Sau khi hoàn thành mẫu này, bạn hiểu cách:

  • Lấy tập dữ liệu từ Kaggle
  • Khám phá dữ liệu và xác định máy biến áp để xử lý trước hình ảnh trước khi đào tạo
  • Xác định một bộ phân loại để có một lớp đầu ra gồm 29 đầu ra
  • Đào tạo các khối cuối cùng của mạng cùng với bộ phân loại đã được xác định
  • Kiểm tra mô hình được đào tạo

Dòng chảy

flow

  1. Đăng nhập vào Watson Studio.
  2. Nhận thông tin đăng nhập API Kaggle của bạn.
  3. Chạy Máy tính xách tay Jupyter trong Watson Studio.

Hướng Dẫn

Nhận các bước chi tiết trong readme tập tin. Các bước đó chỉ ra cách:

  1. Đăng ký Watson Studio.
  2. Tạo một dự án mới.
  3. Tạo sổ ghi chép.
  4. Chạy sổ ghi chép.
  5. Kiểm tra mô hình của bạn.

Nguồn: https://developer.ibm.com/patterns/build-an-american-sign-language-alphabet-classifier-using-pytorch-and-gpu-en canh-on-watson-studio/

Dấu thời gian:

Thêm từ Nhà phát triển IBM