DeepGBASS: segmentacja semantyczna z głębokim przewodnikiem i świadomością granic

DeepGBASS: segmentacja semantyczna z głębokim przewodnikiem i świadomością granic

Węzeł źródłowy: 1907297

Korzystanie z sieci Deep Guided Decoder (DGD), przeszkolonych w oparciu o nowatorską strategię Semantic Boundary-Aware Learning (SBAL), w celu poprawy dokładności granic semantycznych.

popularność

Semantyczna segmentacja obrazu jest powszechnie stosowana w aplikacjach do rozpoznawania scen, takich jak kamera AI, które wymagają dużej dokładności i wydajności. Głębokie uczenie się znacznie rozwinęło najnowocześniejszą segmentację semantyczną. Jednak wiele najnowszych prac dotyczących segmentacji semantycznej uwzględnia jedynie dokładność klas i ignoruje dokładność na granicach między klasami semantycznymi. Aby poprawić dokładność granic semantycznych, proponujemy sieci z głębokim dekoderem kierowanym (DGD) o niskiej złożoności, trenowane przy użyciu nowatorskiej strategii uczenia się z świadomością granic semantycznych (SBAL). Nasze badania ablacyjne dotyczące Cityscapes i ADE20K-32 potwierdzają skuteczność naszego podejścia w przypadku sieci o różnym stopniu złożoności. Pokazujemy, że nasze podejście DeepGBASS znacząco poprawia mIoU nawet o 11% względnego wzmocnienia i średni wynik graniczny F1 (mBF) nawet o 39.4% podczas szkolenia MobileNetEdgeTPU DeepLab na zestawie danych ADE20K-32.

Autorzy: Qingfeng Liu, Hai Su, Mostafa El-Khamy, Kee-Bong Song, z SOC Multimedia R&D, Samsung Semiconductor, Inc., USA

Opublikowane w: ICASSP 2022 – 2022 Międzynarodowa konferencja IEEE na temat akustyki, mowy i przetwarzania sygnałów (ICASSP)

DOI: 10.1109/ICASSP43922.2022.9747892

Kliknij tutaj aby przeczytać więcej.

Znak czasu:

Więcej z Inżynieria semi