Construiți un model de clasificare a imaginilor

Nodul sursă: 748605

Rezumat

Acest model de cod explică cum se clasifică un alfabet ASL (American Sign Language) folosind PyTorch și rețelele de învățare profundă. Utilizează un model preantrenat de la grădina zoologică model PyTorch și reantrenează ultima parte a rețelei.

Descriere

Modelul de cod folosește PyTorch pentru a construi și a antrena un model de învățare profundă pentru a clasifica imaginile în 29 de clase (26 de alfabet ASL, spațiu, Del și nimic), care poate fi folosit ulterior pentru a ajuta persoanele cu deficiențe de auz să comunice și cu ceilalți. ca la computere. Modelul folosește o rețea mobilă preantrenată, definește un clasificator și îl conectează la rețea. Apoi antrenează acest clasificator împreună cu unele dintre ultimele blocuri ale rețelei din setul de date. Modelul utilizează mediul Python și GPU din IBM® Watson™ Studio pentru un antrenament mai rapid, ceea ce vă permite să descărcați, să explorați, să construiți și să vă antrenați modelul. Află mai multe despre mediile Watson Studio disponibile.

După finalizarea acestui model, înțelegeți cum să:

  • Obțineți un set de date de la Kaggle
  • Explorați datele și definiți transformatoare pentru a preprocesa imaginile înainte de antrenament
  • Definiți un clasificator pentru a avea un strat de ieșire de 29 de ieșiri
  • Antrenează ultimele blocuri ale rețelei împreună cu clasificatorul care este definit
  • Testați modelul antrenat

Debit

flow

  1. Conectați-vă la Watson Studio.
  2. Obțineți acreditările API Kaggle.
  3. Rulați Jupyter Notebook în Watson Studio.

Instrucțiuni

Obțineți pași detaliați în Readme fişier. Acești pași arată cum să:

  1. Înscrieți-vă la Watson Studio.
  2. Creați un nou proiect.
  3. Creați caietul.
  4. Rulați caietul.
  5. Testați-vă modelul.

Sursa: https://developer.ibm.com/patterns/build-an-american-sign-language-alphabet-classifier-using-pytorch-and-gpu-environments-on-watson-studio/

Timestamp-ul:

Mai mult de la Dezvoltator IBM