Construir um modelo de classificação de imagens

Nó Fonte: 748605

Resumo

Este padrão de código explica como classificar um alfabeto da linguagem de sinais americana (ASL) usando PyTorch e redes de aprendizagem profunda. Ele usa um modelo pré-treinado do zoológico de modelos PyTorch e retreia a última parte da rede.

Descrição

O padrão de código usa PyTorch para construir e treinar um modelo de aprendizado profundo para classificar imagens em 29 classes (26 ASL alfabeto, espaço, Del e nada), que podem ser usados ​​posteriormente para ajudar pessoas com deficiência auditiva a se comunicarem com outras também como acontece com os computadores. O padrão usa uma rede móvel pré-treinada, define um classificador e o conecta à rede. Em seguida, ele treina esse classificador junto com alguns dos últimos blocos da rede no conjunto de dados. O padrão usa o ambiente Python e GPU no IBM® Watson ™ Studio para treinamento mais rápido, o que permite fazer download, explorar, construir e treinar seu modelo. Aprender mais sobre ambientes Watson Studio disponíveis.

Depois de completar este padrão, você entenderá como:

  • Obtenha um conjunto de dados de Kaggle
  • Explorar dados e definir transformadores para pré-processar imagens antes do treinamento
  • Defina um classificador para ter uma camada de saída de 29 saídas
  • Treine os últimos blocos da rede junto com o classificador que está definido
  • Teste o modelo treinado

Fluxo

flow

  1. Faça login no Watson Studio.
  2. Obtenha suas credenciais da API Kaggle.
  3. Execute o Jupyter Notebook no Watson Studio.

Instruções

Obtenha etapas detalhadas no readme Arquivo. Essas etapas mostram como:

  1. Inscreva-se no Watson Studio.
  2. Crie um novo projeto.
  3. Crie o bloco de notas.
  4. Execute o notebook.
  5. Teste seu modelo.

Fonte: https://developer.ibm.com/patterns/build-an-american-sign-language-alphabet-classifier-using-pytorch-and-gpu-environments-on-watson-studio/

Carimbo de hora:

Mais de Desenvolvedor IBM