Bygg en bildeklassifiseringsmodell

Kilde node: 748605

Oppsummering

Dette kodemønsteret forklarer hvordan man kan klassifisere et amerikansk tegnspråk (ASL) alfabet ved hjelp av PyTorch og deep learning nettverk. Den bruker en forhåndsopplært modell fra PyTorch-modellparken og omskoler den siste delen av nettverket.

Beskrivelse

Kodemønsteret bruker PyTorch til å bygge og trene en dyp læringsmodell for å klassifisere bilder til 29 klasser (26 ASL-alfabet, mellomrom, del og ingenting), som kan brukes senere for å hjelpe hørselshemmede med å kommunisere med andre også som med datamaskiner. Mønsteret bruker et forhåndsopplært mobilnett, definerer en klassifikator og kobler det til nettverket. Deretter trener den denne klassifisereren sammen med noen av de siste blokkene i nettverket på datasettet. Mønsteret bruker Python- og GPU-miljøet i IBM® Watson ™ Studio for raskere trening, som lar deg laste ned, utforske, bygge og trene modellen din. Lære mer om tilgjengelige Watson Studio-miljøer.

Etter å ha fullført dette mønsteret forstår du hvordan du:

  • Få et datasett fra Kaggle
  • Utforsk data og definer transformatorer for å forhåndsbehandle bilder før trening
  • Definer en klassifikator for å ha et utgangslag på 29 utganger
  • Tren de siste blokkene i nettverket sammen med klassifisereren som er definert
  • Test den trente modellen

Flow

flow

  1. Logg på Watson Studio.
  2. Få Kaggle API-legitimasjon.
  3. Kjør Jupyter Notebook i Watson Studio.

Instruksjoner

Få detaljerte trinn i readme fil. Disse trinnene viser hvordan du:

  1. Registrer deg for Watson Studio.
  2. Lag et nytt prosjekt.
  3. Lag notatboken.
  4. Kjør notatboken.
  5. Test modellen din.

Kilde: https://developer.ibm.com/patterns/build-an-american-sign-language-alphabet-classifier-using-pytorch-and-gpu-environments-on-watson-studio/

Tidstempel:

Mer fra IBM-utvikler