Byg en billedklassificeringsmodel

Kildeknude: 748605

Resumé

Dette kodemønster forklarer, hvordan man klassificerer et amerikansk tegnsprog (ASL) alfabet ved hjælp af PyTorch og deep learning netværk. Den bruger en fortrænet model fra PyTorch models zoo og genoptræner den sidste del af netværket.

Beskrivelse

Kodemønsteret bruger PyTorch til at bygge og træne en dyb læringsmodel til at klassificere billeder til 29 klasser (26 ASL-alfabet, space, Del og ingenting), som senere kan bruges til at hjælpe hørehæmmede med at kommunikere med andre såvel som med computere. Mønsteret bruger et forudtrænet mobilnetværk, definerer en klassifikator og forbinder det med netværket. Det træner derefter denne klassifikator sammen med nogle af de sidste blokke af netværket på datasættet. Mønsteret bruger Python- og GPU-miljøet i IBM® Watson™ Studio til hurtigere træning, som giver dig mulighed for at downloade, udforske, bygge og træne din model. Lær mere om tilgængelige Watson Studio-miljøer.

Når du har gennemført dette mønster, forstår du, hvordan du:

  • Få et datasæt fra Kaggle
  • Udforsk data og definer transformere til at forbehandle billeder før træning
  • Definer en klassifikator til at have et outputlag på 29 output
  • Træn de sidste blokke af netværket sammen med klassificeringen, der er defineret
  • Test den trænede model

Flow

flow

  1. Log ind på Watson Studio.
  2. Få dine Kaggle API-legitimationsoplysninger.
  3. Kør Jupyter Notebook i Watson Studio.

Instruktioner

Få detaljerede trin i readme fil. Disse trin viser, hvordan du:

  1. Tilmeld dig Watson Studio.
  2. Opret et nyt projekt.
  3. Opret notesbogen.
  4. Kør notesbogen.
  5. Test din model.

Kilde: https://developer.ibm.com/patterns/build-an-american-sign-language-alphabet-classifier-using-pytorch-and-gpu-environments-on-watson-studio/

Tidsstempel:

Mere fra IBM-udvikler