Rotationserkennung von Zielen in Fernerkundungsbildern durch Fusion von Hintergrund- und Richtungsinformationen

HU Henan ,  

MA Aoyang ,  

LI Ronghua ,  

摘要

Um das Problem unzureichender Erkennungsgenauigkeit aufgrund großer Zielgrößenunterschiede und komplexer Richtungsverteilungen bei der Zielerkennung in Fernerkundungsbildern zu lösen, wird ein Erkennungsnetzwerk vorgeschlagen, das Hintergrundinformationen und Richtungsinformationen fusioniert. Erstens wurde für das Problem der großen Zielgrößenunterschiede ein Modul zur Erweiterung des rezeptiven Feldes (Receptive Field Extending, RFE) entwickelt. Im Gegensatz zu herkömmlichen festen rezeptiven Feldern oder komplexen Mehrzweigstrukturen integriert dieses Modul mithilfe von Großkernzerlegung, dilatierten Faltungen und paralleler Verzweigungsstruktur mehrskalige Hintergrundinformationen, ohne die Rechenlast erheblich zu erhöhen, und löst damit das Problem der unterschiedlichen Anforderungen an Hintergrundinformationen verschiedener Zielgrößen. Zweitens wurde für das Problem der komplexen Zielrichtungsverteilung ein richtungswahrnehmungsfähiger Kreuzaufmerksamkeitsmechanismus (Orientation Aware Cross Attention, OACA) entwickelt. Im Gegensatz zu den Kernformen bestehender Aufmerksamkeitsmechanismen extrahiert dieses Modul Richtungsstrukturinformationen mithilfe horizontaler und vertikaler separabler Faltungen, um Merkmalsverluste und -unterbrechungen zu verhindern; gleichzeitig wurde ein Kreuzaufmerksamkeitsmechanismus entwickelt, der Hintergrundrauschen unterdrückt und die Interaktivität der Richtungsinformationen verstärkt. Experimentelle Ergebnisse zeigen, dass die vorgeschlagene Methode auf den Datensätzen DOTA, HRSC2016 und DIOR-R Erkennungsgenauigkeiten von 76,88%, 98,43% bzw. 65,06% erreicht, was gegenüber der Oriented R-CNN-Methode eine Steigerung von 1,01%, 0,83% und 0,76% darstellt und die Wirksamkeit der Zusammenarbeit von Hintergrund- und Richtungsinformationen weiter bestätigt.

关键词

Fernerkundungsbilder; Rotationserkennung von Zielen; Erweiterung des rezeptiven Feldes; richtungswahrnehmungsfähiger Kreuzaufmerksamkeitsmechanismus

阅读全文