Zbuduj model klasyfikacji obrazów

Węzeł źródłowy: 748605

Podsumowanie

Ten wzorzec kodu wyjaśnia, jak sklasyfikować alfabet amerykańskiego języka migowego (ASL) za pomocą PyTorch i sieci głębokiego uczenia. Wykorzystuje wstępnie wytrenowany model z zoo PyTorch models i ponownie trenuje ostatnią część sieci.

Opis

Wzorzec kodu wykorzystuje PyTorch do budowania i trenowania modelu uczenia głębokiego w celu klasyfikowania obrazów do 29 klas (alfabet 26 ASL, spacja, Del i nic), które mogą być później użyte, aby pomóc osobom niedosłyszącym komunikować się z innymi jak z komputerami. Wzorzec wykorzystuje wstępnie wytrenowaną sieć komórkową, definiuje klasyfikator i łączy go z siecią. Następnie trenuje ten klasyfikator wraz z niektórymi z ostatnich bloków sieci w zestawie danych. Wzorzec wykorzystuje środowisko Python i GPU w IBM® Watson ™ Studio w celu szybszego szkolenia, które umożliwia pobieranie, eksplorowanie, budowanie i trenowanie modelu. Dowiedz się więcej o dostępne środowiska Watson Studio.

Po wykonaniu tego wzoru rozumiesz, jak:

  • Zdobądź zestaw danych od Kaggle
  • Eksploruj dane i definiuj transformatory, aby wstępnie przetwarzać obrazy przed uczeniem
  • Zdefiniuj klasyfikator tak, aby miał warstwę wyjściową składającą się z 29 wyjść
  • Wytrenuj ostatnie bloki sieci wraz ze zdefiniowanym klasyfikatorem
  • Przetestuj wytrenowany model

Przepływ

flow

  1. Zaloguj się do Watson Studio.
  2. Uzyskaj dane logowania do Kaggle API.
  3. Uruchom notatnik Jupyter w Watson Studio.

Instrukcje

Uzyskaj szczegółowe instrukcje w readme plik. Te kroki pokazują, jak:

  1. Zarejestruj się w Watson Studio.
  2. Utwórz nowy projekt.
  3. Utwórz notatnik.
  4. Uruchom notatnik.
  5. Przetestuj swój model.

Źródło: https://developer.ibm.com/patterns/build-an-american-sign-language-alphabet-classifier-using-pytorch-and-gpu-environments-on-watson-studio/

Znak czasu:

Więcej z Programista IBM