Crea un modello di classificazione delle immagini

Nodo di origine: 748605

Sommario

Questo modello di codice spiega come classificare un alfabeto della lingua dei segni americana (ASL) utilizzando PyTorch e le reti di deep learning. Utilizza un modello preaddestrato dallo zoo dei modelli PyTorch e riaddestra l'ultima parte della rete.

Descrizione

Il modello di codice utilizza PyTorch per creare e addestrare un modello di deep learning per classificare le immagini in 29 classi (26 lettere ASL, spazio, Canc e niente), che possono essere utilizzate in seguito per aiutare anche le persone con problemi di udito a comunicare con gli altri come con i computer. Il modello usa una rete mobile preaddestrata, definisce un classificatore e lo connette alla rete. Quindi addestra questo classificatore insieme ad alcuni degli ultimi blocchi della rete sul set di dati. Il pattern utilizza l'ambiente Python e GPU in IBM® Watson™ Studio per un training più rapido, che ti consente di scaricare, esplorare, creare e addestrare il tuo modello. Impara di più riguardo ambienti Watson Studio disponibili.

Dopo aver completato questo schema, capisci come:

  • Ottieni un set di dati da Kaggle
  • Esplora i dati e definisci i trasformatori per pre-elaborare le immagini prima dell'addestramento
  • Definire un classificatore per avere un livello di output di 29 output
  • Addestra gli ultimi blocchi della rete insieme al classificatore definito
  • Testare il modello addestrato

Flow

flow

  1. Accedi a Watson Studio.
  2. Ottieni le tue credenziali API Kaggle.
  3. Esegui Jupyter Notebook in Watson Studio.

Istruzioni

Ottieni passaggi dettagliati in readme file. Questi passaggi mostrano come:

  1. Iscriviti a Watson Studio.
  2. Crea un nuovo progetto.
  3. Crea il taccuino.
  4. Esegui il notebook.
  5. Metti alla prova il tuo modello.

Fonte: https://developer.ibm.com/patterns/build-an-american-sign-language-alphabet-classifier-using-pytorch-and-gpu-environments-on-watson-studio/

Timestamp:

Di più da Sviluppatore IBM