DeepGBASS: segmentazione semantica consapevole dei confini guidata in profondità

DeepGBASS: segmentazione semantica consapevole dei confini guidata in profondità

Nodo di origine: 1907297

Utilizzo di reti Deep Guided Decoder (DGD), addestrate con una nuova strategia Semantic Boundary-Aware Learning (SBAL), al fine di migliorare l'accuratezza dei confini semantici.

popolarità

La segmentazione semantica delle immagini viene utilizzata ovunque nelle applicazioni di comprensione della scena, come AI Camera, che richiedono elevata precisione ed efficienza. Il deep learning ha fatto avanzare significativamente lo stato dell’arte nella segmentazione semantica. Tuttavia, molti dei recenti lavori di segmentazione semantica considerano solo l'accuratezza delle classi e ignorano l'accuratezza ai confini tra le classi semantiche. Per migliorare l'accuratezza del confine semantico, proponiamo reti Deep Guided Decoder (DGD) a bassa complessità, addestrate con una nuova strategia Semantic Boundary-Aware Learning (SBAL). I nostri studi di ablazione su Cityscapes e ADE20K-32 confermano l'efficacia del nostro approccio con reti di diversa complessità. Mostriamo che il nostro approccio DeepGBASS migliora significativamente il mIoU fino all'11% di guadagno relativo e il punteggio F1 del limite medio (mBF) fino al 39.4% durante l'addestramento di MobileNetEdgeTPU DeepLab sul set di dati ADE20K-32.

Autori: Qingfeng Liu, Hai Su, Mostafa El-Khamy, Kee-Bong Song, di SOC Multimedia R&D, Samsung Semiconductor, Inc., USA

Pubblicato in: ICASSP 2022 – Conferenza internazionale IEEE 2022 sull'acustica, il parlato e l'elaborazione dei segnali (ICASSP)

DOI: 10.1109/ICASSP43922.2022.9747892

Clicchi qui leggere di più

Timestamp:

Di più da Semiingegneria