สร้างแบบจำลองการจัดประเภทรูปภาพ

โหนดต้นทาง: 748605

สรุป

รูปแบบรหัสนี้อธิบายวิธีจำแนกตัวอักษรภาษามือแบบอเมริกัน (ASL) โดยใช้ PyTorch และเครือข่ายการเรียนรู้เชิงลึก ใช้โมเดลที่ได้รับการฝึกจากสวนสัตว์จำลอง PyTorch และฝึกซ้ำส่วนสุดท้ายของเครือข่าย

รายละเอียด

รูปแบบโค้ดใช้ PyTorch เพื่อสร้างและฝึกโมเดลการเรียนรู้เชิงลึกเพื่อจำแนกรูปภาพเป็น 29 คลาส (ตัวอักษร ASL 26 ตัว ช่องว่าง เดล และไม่มีอะไรเลย) ซึ่งสามารถใช้ในภายหลังเพื่อช่วยให้ผู้ที่มีปัญหาในการได้ยินสื่อสารกับผู้อื่นได้เช่นกัน เช่นเดียวกับคอมพิวเตอร์ รูปแบบนี้ใช้เครือข่ายมือถือที่ได้รับการฝึกฝน กำหนดตัวแยกประเภท และเชื่อมต่อกับเครือข่าย จากนั้นจะฝึกลักษณนามนี้พร้อมกับกลุ่มสุดท้ายของเครือข่ายในชุดข้อมูล รูปแบบนี้ใช้สภาพแวดล้อม Python และ GPU ใน IBM® Watson™ Studio เพื่อการฝึกที่เร็วขึ้น ซึ่งช่วยให้คุณดาวน์โหลด สำรวจ สร้าง และฝึกโมเดลของคุณ ดูข้อมูลเพิ่มเติมเกี่ยวกับ สภาพแวดล้อมที่วัตสันสตูดิโอใช้ได้.

หลังจากเสร็จสิ้นรูปแบบนี้ คุณจะเข้าใจวิธี:

  • รับชุดข้อมูลจาก Kaggle
  • สำรวจข้อมูลและกำหนดหม้อแปลงเพื่อประมวลผลภาพล่วงหน้าก่อนการฝึก
  • กำหนดตัวแยกประเภทให้มีชั้นเอาต์พุต 29 เอาต์พุต
  • ฝึกบล็อกสุดท้ายของเครือข่ายพร้อมกับตัวแยกประเภทที่กำหนดไว้
  • ทดสอบโมเดลฝึก

ไหล

flow

  1. เข้าสู่ระบบ วัตสัน สตูดิโอ
  2. รับข้อมูลประจำตัว Kaggle API ของคุณ
  3. เรียกใช้ Jupyter Notebook ใน Watson Studio

คำแนะนำ

รับขั้นตอนโดยละเอียดใน README ไฟล์. ขั้นตอนเหล่านี้แสดงวิธี:

  1. สมัครสมาชิกวัตสันสตูดิโอ
  2. สร้างโครงการใหม่
  3. สร้างสมุดบันทึก
  4. เรียกใช้โน้ตบุ๊ก
  5. ทดสอบโมเดลของคุณ

ที่มา: https://developer.ibm.com/patterns/build-an-american-sign-language-alphabet-classifier-using-pytorch-and-gpu-environments-on-watson-studio/

ประทับเวลา:

เพิ่มเติมจาก นักพัฒนาไอบีเอ็ม