Sommario
Questo modello di codice spiega come classificare un alfabeto della lingua dei segni americana (ASL) utilizzando PyTorch e le reti di deep learning. Utilizza un modello preaddestrato dallo zoo dei modelli PyTorch e riaddestra l'ultima parte della rete.
Descrizione
Il modello di codice utilizza PyTorch per creare e addestrare un modello di deep learning per classificare le immagini in 29 classi (26 lettere ASL, spazio, Canc e niente), che possono essere utilizzate in seguito per aiutare anche le persone con problemi di udito a comunicare con gli altri come con i computer. Il modello usa una rete mobile preaddestrata, definisce un classificatore e lo connette alla rete. Quindi addestra questo classificatore insieme ad alcuni degli ultimi blocchi della rete sul set di dati. Il pattern utilizza l'ambiente Python e GPU in IBM® Watson™ Studio per un training più rapido, che ti consente di scaricare, esplorare, creare e addestrare il tuo modello. Impara di più riguardo ambienti Watson Studio disponibili.
Dopo aver completato questo schema, capisci come:
- Ottieni un set di dati da Kaggle
- Esplora i dati e definisci i trasformatori per pre-elaborare le immagini prima dell'addestramento
- Definire un classificatore per avere un livello di output di 29 output
- Addestra gli ultimi blocchi della rete insieme al classificatore definito
- Testare il modello addestrato
Flow
- Accedi a Watson Studio.
- Ottieni le tue credenziali API Kaggle.
- Esegui Jupyter Notebook in Watson Studio.
Istruzioni
Ottieni passaggi dettagliati in readme file. Questi passaggi mostrano come:
- Iscriviti a Watson Studio.
- Crea un nuovo progetto.
- Crea il taccuino.
- Esegui il notebook.
- Metti alla prova il tuo modello.