Resumo
Este padrão de código explica como classificar um alfabeto da linguagem de sinais americana (ASL) usando PyTorch e redes de aprendizagem profunda. Ele usa um modelo pré-treinado do zoológico de modelos PyTorch e retreia a última parte da rede.
Descrição
O padrão de código usa PyTorch para construir e treinar um modelo de aprendizado profundo para classificar imagens em 29 classes (26 ASL alfabeto, espaço, Del e nada), que podem ser usados posteriormente para ajudar pessoas com deficiência auditiva a se comunicarem com outras também como acontece com os computadores. O padrão usa uma rede móvel pré-treinada, define um classificador e o conecta à rede. Em seguida, ele treina esse classificador junto com alguns dos últimos blocos da rede no conjunto de dados. O padrão usa o ambiente Python e GPU no IBM® Watson ™ Studio para treinamento mais rápido, o que permite fazer download, explorar, construir e treinar seu modelo. Aprender mais sobre ambientes Watson Studio disponíveis.
Depois de completar este padrão, você entenderá como:
- Obtenha um conjunto de dados de Kaggle
- Explorar dados e definir transformadores para pré-processar imagens antes do treinamento
- Defina um classificador para ter uma camada de saída de 29 saídas
- Treine os últimos blocos da rede junto com o classificador que está definido
- Teste o modelo treinado
Fluxo
- Faça login no Watson Studio.
- Obtenha suas credenciais da API Kaggle.
- Execute o Jupyter Notebook no Watson Studio.
Instruções
Obtenha etapas detalhadas no readme Arquivo. Essas etapas mostram como:
- Inscreva-se no Watson Studio.
- Crie um novo projeto.
- Crie o bloco de notas.
- Execute o notebook.
- Teste seu modelo.