DeepGBASS: การแบ่งส่วนความหมายตามขอบเขตเชิงลึก

DeepGBASS: การแบ่งส่วนความหมายตามขอบเขตเชิงลึก

โหนดต้นทาง: 1907297

การใช้เครือข่าย Deep Guided Decoder (DGD) ซึ่งได้รับการฝึกฝนด้วยกลยุทธ์ Semantic Boundary-Aware Learning (SBAL) ใหม่ เพื่อปรับปรุงความแม่นยำของขอบเขตความหมาย

ความนิยม

การแบ่งส่วนความหมายของภาพถูกนำมาใช้อย่างแพร่หลายในแอปพลิเคชันทำความเข้าใจฉาก เช่น กล้อง AI ซึ่งต้องการความแม่นยำและประสิทธิภาพสูง การเรียนรู้เชิงลึกได้พัฒนาความล้ำสมัยในการแบ่งส่วนความหมายอย่างมีนัยสำคัญ อย่างไรก็ตาม การแบ่งส่วนความหมายล่าสุดจำนวนมากจะพิจารณาเฉพาะความถูกต้องของคลาสเท่านั้น และไม่สนใจความถูกต้องที่ขอบเขตระหว่างคลาสความหมาย เพื่อปรับปรุงความแม่นยำของขอบเขตความหมาย เราขอเสนอเครือข่าย Deep Guided Decoder (DGD) ที่มีความซับซ้อนต่ำ ซึ่งได้รับการฝึกฝนด้วยกลยุทธ์ Semantic Boundary-Aware Learning (SBAL) ใหม่ การศึกษาการระเหยของเราเกี่ยวกับ Cityscapes และ ADE20K-32 ยืนยันประสิทธิผลของแนวทางของเรากับเครือข่ายที่มีความซับซ้อนต่างกัน เราแสดงให้เห็นว่าแนวทาง DeepGBASS ของเราปรับปรุง mIoU อย่างมีนัยสำคัญโดยได้รับสัมพัทธ์เพิ่มขึ้นถึง 11% และขอบเขตเฉลี่ย F1-score (mBF) ได้ถึง 39.4% เมื่อฝึกฝน MobileNetEdgeTPU DeepLab บนชุดข้อมูล ADE20K-32

ผู้เขียน: Qingfeng Liu, Hai Su, Mostafa El-Khamy, Kee-Bong Song จาก SOC Multimedia R&D, Samsung Semiconductor, Inc., สหรัฐอเมริกา

ตีพิมพ์ใน: ICASSP 2022 – 2022 การประชุมนานาชาติ IEEE ด้านอะคูสติก คำพูด และการประมวลผลสัญญาณ (ICASSP)

ดอย: 10.1109/ICASSP43922.2022.9747892

คลิก โปรดคลิกที่นี่เพื่ออ่านรายละเอียดเพิ่มเติม อ่านเพิ่มเติม

ประทับเวลา:

เพิ่มเติมจาก กึ่งวิศวกรรม