Podsumowanie
Ten wzorzec kodu wyjaśnia, jak sklasyfikować alfabet amerykańskiego języka migowego (ASL) za pomocą PyTorch i sieci głębokiego uczenia. Wykorzystuje wstępnie wytrenowany model z zoo PyTorch models i ponownie trenuje ostatnią część sieci.
Opis
Wzorzec kodu wykorzystuje PyTorch do budowania i trenowania modelu uczenia głębokiego w celu klasyfikowania obrazów do 29 klas (alfabet 26 ASL, spacja, Del i nic), które mogą być później użyte, aby pomóc osobom niedosłyszącym komunikować się z innymi jak z komputerami. Wzorzec wykorzystuje wstępnie wytrenowaną sieć komórkową, definiuje klasyfikator i łączy go z siecią. Następnie trenuje ten klasyfikator wraz z niektórymi z ostatnich bloków sieci w zestawie danych. Wzorzec wykorzystuje środowisko Python i GPU w IBM® Watson ™ Studio w celu szybszego szkolenia, które umożliwia pobieranie, eksplorowanie, budowanie i trenowanie modelu. Dowiedz się więcej o dostępne środowiska Watson Studio.
Po wykonaniu tego wzoru rozumiesz, jak:
- Zdobądź zestaw danych od Kaggle
- Eksploruj dane i definiuj transformatory, aby wstępnie przetwarzać obrazy przed uczeniem
- Zdefiniuj klasyfikator tak, aby miał warstwę wyjściową składającą się z 29 wyjść
- Wytrenuj ostatnie bloki sieci wraz ze zdefiniowanym klasyfikatorem
- Przetestuj wytrenowany model
Przepływ
- Zaloguj się do Watson Studio.
- Uzyskaj dane logowania do Kaggle API.
- Uruchom notatnik Jupyter w Watson Studio.
Instrukcje
Uzyskaj szczegółowe instrukcje w readme plik. Te kroki pokazują, jak:
- Zarejestruj się w Watson Studio.
- Utwórz nowy projekt.
- Utwórz notatnik.
- Uruchom notatnik.
- Przetestuj swój model.