DeepGBASS: Phân đoạn ngữ nghĩa nhận biết ranh giới có hướng dẫn sâu

DeepGBASS: Phân đoạn ngữ nghĩa nhận biết ranh giới có hướng dẫn sâu

Nút nguồn: 1907297

Sử dụng mạng Bộ giải mã có hướng dẫn sâu (DGD), được đào tạo bằng chiến lược Học tập nhận biết ranh giới ngữ nghĩa (SBAL) mới, để cải thiện độ chính xác của ranh giới ngữ nghĩa.

phổ biến

Phân đoạn ngữ nghĩa hình ảnh được sử dụng phổ biến trong các ứng dụng hiểu cảnh, chẳng hạn như Camera AI, đòi hỏi độ chính xác và hiệu quả cao. Học sâu đã nâng cao đáng kể công nghệ tiên tiến nhất trong phân đoạn ngữ nghĩa. Tuy nhiên, nhiều công trình phân đoạn ngữ nghĩa gần đây chỉ xem xét độ chính xác của lớp và bỏ qua độ chính xác tại ranh giới giữa các lớp ngữ nghĩa. Để cải thiện độ chính xác của ranh giới ngữ nghĩa, chúng tôi đề xuất các mạng Bộ giải mã có hướng dẫn sâu (DGD) có độ phức tạp thấp, được đào tạo bằng chiến lược Học tập nhận biết ranh giới ngữ nghĩa (SBAL) mới. Các nghiên cứu cắt bỏ của chúng tôi trên Cityscapes và ADE20K-32 xác nhận tính hiệu quả của phương pháp tiếp cận của chúng tôi với mạng lưới có độ phức tạp khác nhau. Chúng tôi cho thấy rằng phương pháp DeepGBASS của chúng tôi cải thiện đáng kể mIoU lên tới 11% mức tăng tương đối và điểm F1 ranh giới trung bình (mBF) lên tới 39.4% khi đào tạo MobileNetEdgeTPU DeepLab trên bộ dữ liệu ADE20K-32.

tác giả: Qingfeng Liu, Hai Su, Mostafa El-Khamy, Kee-Bong Song, của SOC Multimedia R&D, Samsung Semiconductor, Inc., USA

Xuất bản trong: ICASSP 2022 – 2022 Hội nghị quốc tế về âm thanh, giọng nói và xử lý tín hiệu của IEEE (ICASSP)

DOI: 10.1109/ICASSP43922.2022.9747892

Nhấp chuột tại đây để đọc thêm

Dấu thời gian:

Thêm từ Bán kỹ thuật