DeepGBASS : segmentation sémantique guidée en profondeur et sensible aux limites

DeepGBASS : segmentation sémantique guidée en profondeur et sensible aux limites

Nœud source: 1907297

Utilisation de réseaux Deep Guided Decoder (DGD), entraînés avec une nouvelle stratégie d'apprentissage sémantique sensible aux limites (SBAL), afin d'améliorer la précision des limites sémantiques.

popularité

La segmentation sémantique des images est omniprésente dans les applications de compréhension de scènes, telles que AI Camera, qui nécessitent une précision et une efficacité élevées. L’apprentissage profond a considérablement fait progresser l’état de l’art en matière de segmentation sémantique. Cependant, de nombreux travaux récents sur la segmentation sémantique considèrent uniquement l’exactitude des classes et ignorent les précisions aux frontières entre les classes sémantiques. Pour améliorer la précision des limites sémantiques, nous proposons des réseaux de décodage guidé profond (DGD) de faible complexité, formés avec une nouvelle stratégie d'apprentissage sémantique sensible aux limites (SBAL). Nos études d'ablation sur Cityscapes et l'ADE20K-32 confirment l'efficacité de notre approche avec des réseaux de différentes complexités. Nous montrons que notre approche DeepGBASS améliore considérablement le mIoU jusqu'à 11 % de gain relatif et le score moyen F1 (mBF) jusqu'à 39.4 % lors de la formation de MobileNetEdgeTPU DeepLab sur l'ensemble de données ADE20K-32.

Auteurs: Qingfeng Liu, Hai Su, Mostafa El-Khamy, Kee-Bong Song, de SOC Multimedia R&D, Samsung Semiconductor, Inc., États-Unis

Publié dans: ICASSP 2022 – Conférence internationale IEEE 2022 sur l'acoustique, la parole et le traitement du signal (ICASSP)

DOI: 10.1109/ICASSP43922.2022.9747892

Cliquez ici lire plus.

Horodatage:

Plus de Semi-ingénierie