Skapa en bildklassificeringsmodell

Källnod: 748605

Sammanfattning

Detta kodmönster förklarar hur man klassificerar ett amerikanskt teckenspråk (ASL) alfabet med hjälp av PyTorch och deep learning-nätverk. Den använder en förutbildad modell från PyTorch-modellparken och omskolar den sista delen av nätverket.

Beskrivning

Kodmönstret använder PyTorch för att bygga och träna en djup inlärningsmodell för att klassificera bilder till 29 klasser (26 ASL-alfabet, utrymme, Del och ingenting), som kan användas senare för att hjälpa hörselskadade att kommunicera med andra också som med datorer. Mönstret använder ett förutbildat mobilnätverk, definierar en klassificering och ansluter det till nätverket. Det tränar sedan denna klassificering tillsammans med några av de sista blocken i nätverket på datamängden. Mönstret använder Python- och GPU-miljön i IBM® Watson ™ Studio för snabbare träning, vilket gör att du kan ladda ner, utforska, bygga och träna din modell. Lära sig mer om tillgängliga Watson Studio-miljöer.

Efter att ha slutfört detta mönster förstår du hur man:

  • Skaffa en datamängd från Kaggle
  • Utforska data och definiera transformatorer för att förbehandla bilder före träning
  • Definiera en klassificerare som ska ha ett utgångslager på 29 utgångar
  • Träna de sista blocken i nätverket tillsammans med den klassificering som definierats
  • Testa den utbildade modellen

Flöde

flow

  1. Logga in på Watson Studio.
  2. Få dina Kaggle API-referenser.
  3. Kör Jupyter Notebook i Watson Studio.

Instruktioner

Få detaljerade steg i readme fil. Dessa steg visar hur man:

  1. Registrera dig för Watson Studio.
  2. Skapa ett nytt projekt.
  3. Skapa anteckningsboken.
  4. Kör anteckningsboken.
  5. Testa din modell.

Källa: https://developer.ibm.com/patterns/build-an-american-sign-language-alphabet-classifier-using-pytorch-and-gpu-environments-on-watson-studio/

Tidsstämpel:

Mer från IBM-utvecklare