Städtische Straßensemantik-Segmentierung mit globaler Wahrnehmung und multiskaliger Merkmalsfusion

WU Kaijun ,  

ZHANG Zhirui ,  

WANG Ying ,  

AN Liwei ,  

摘要

Die semantische Segmentierung spielt eine unersetzliche Rolle in Anwendungen des autonomen Fahrens und der intelligenten Verkehrstechnik. Um Probleme mit unklaren Segmentgrenzen, gegenseitiger Objektüberdeckung und Unterschieden in mehreren Maßstäben, die zu unzureichender Segmentierungsgenauigkeit führen, zu adressieren, wird ein städtisches Straßensemantik-Segmentierungsnetzwerk vorgeschlagen, das globale Wahrnehmung und multiskalige Merkmalsfusion kombiniert. Zur Verbesserung des Problems der unscharfen Segmentgrenzen wurde ein globaler Wahrnehmungsmodul entworfen, der durch die Kombination von räumlichen und Kanalinformationen die Interaktion zwischen Merkmalen zur Erfassung globaler Informationen verstärkt; bei gegenseitiger Objektüberdeckung muss das Modell die Empfindlichkeit für verdeckte Bereiche erhöhen, weshalb ein multiskaliges Merkmalsfusionsmodul vorgeschlagen wird, um die Segmentierungsgenauigkeit für große und kleine Objekte zu gewährleisten; es wird ein umfassender mehrgleitender Merkmalsglättungsverlust verwendet, um das Modell zu bewerten, wodurch Merkmale weiter geglättet und das Ziel optimiert wird, um eine optimale Lösung zu erzielen. Experimentelle Ergebnisse zeigen, dass die Methode den mIoU-Wert bei verschiedenen Auflösungen auf dem Cityscapes-Datensatz um 0,5 %, 0,9 % und 1,7 % sowie auf dem ADE20K-Datensatz um 2,1 % verbessert. Im Vergleich zu bestehenden semantischen Segmentierungsnetzmodellen verbessert die Methode die Segmentierungsergebnisse weiter.

关键词

tiefes Lernen;Bildverarbeitung;semantische Segmentierung;Merkmalsfusion;Verlustfunktion

阅读全文