بناء نموذج تصنيف الصورة

عقدة المصدر: 748605

نبذة عامة

يوضح نمط الكود هذا كيفية تصنيف أبجدية لغة الإشارة الأمريكية (ASL) باستخدام PyTorch وشبكات التعلم العميق. يستخدم نموذجًا مُدربًا مسبقًا من حديقة حيوانات نماذج PyTorch ويعيد تدريب الجزء الأخير من الشبكة.

الوصف

يستخدم نمط الكود PyTorch لبناء وتدريب نموذج التعلم العميق لتصنيف الصور إلى 29 فئة (26 أبجدية ASL ، ومساحة ، و Del ، ولا شيء) ، والتي يمكن استخدامها لاحقًا لمساعدة الأشخاص ضعاف السمع على التواصل مع الآخرين أيضًا كما هو الحال مع أجهزة الكمبيوتر. يستخدم النمط شبكة محمولة مسبقة الصنع ، ويحدد المصنف ، ويربطها بالشبكة. ثم يقوم بتدريب هذا المصنف جنبًا إلى جنب مع بعض الكتل الأخيرة للشبكة على مجموعة البيانات. يستخدم النمط بيئة Python و GPU في IBM® Watson ™ Studio لتدريب أسرع ، مما يسمح لك بتنزيل النموذج الخاص بك واستكشافه وبنائه وتدريبه. تعلم المزيد عن بيئات Watson Studio المتاحة.

بعد الانتهاء من هذا النمط ، ستفهم كيفية:

  • احصل على مجموعة بيانات من Kaggle
  • استكشف البيانات وحدد المحولات لمعالجة الصور قبل التدريب
  • حدد المصنف ليكون له طبقة إخراج من 29 ناتجًا
  • قم بتدريب الكتل الأخيرة من الشبكة جنبًا إلى جنب مع المصنف المحدد
  • اختبر النموذج المدرب

التدفق

flow

  1. قم بتسجيل الدخول إلى Watson Studio.
  2. احصل على بيانات اعتماد Kaggle API الخاصة بك.
  3. قم بتشغيل Jupyter Notebook في Watson Studio.

تعليمات

احصل على خطوات مفصلة في ملف التمهيدي ملف. توضح هذه الخطوات كيفية:

  1. قم بالتسجيل في Watson Studio.
  2. إنشاء مشروع جديد.
  3. قم بإنشاء دفتر الملاحظات.
  4. قم بتشغيل دفتر الملاحظات.
  5. اختبر نموذجك.

المصدر: https://developer.ibm.com/patterns/build-an-american-sign-language-alphabet-classifier-using-pytorch-and-gpu-environment-on-watson-studio/

الطابع الزمني:

اكثر من IBM Developer