RSF-DETR: Straßenschadensdetektion durch räumlich-frequenzbasierte Verstärkung und kontextgesteuerte Rekonstruktion

ZHOU Dongmei ,  

WU Bingbing ,  

LIU Xiaoming ,  

YAN Haowen ,  

WU Xiaosuo ,  

摘要

Angesichts der vielfältigen Formen von Straßenschäden, der geringen Erkennungsgenauigkeit und der hohen Auslassungsrate schlägt dieser Artikel eine verbesserte Methode basierend auf dem RT-DETR-Modell vor. Zunächst wurde basierend auf der gemeinsamen Idee der räumlichen Hochfrequenz-Kantenerhöhung und der globalen Merkmalextraktion im Frequenzbereich das räumlich-frequenzbasierte duale Merkmalverstärkungsmodul FreSCal entworfen, das die Fähigkeit des Modells zur Extraktion von Ziel- und Kantendaten verbessert und die Unterscheidungskraft zwischen Zielregionen und Hintergrund erhöht. Zweitens wurde inspiriert von der kontextgesteuerten Merkmalsrekonstruktion des CGRSeg-Netzwerks das kontextgesteuerte räumliche Merkmalsrekonstruktions-Pyramidennetzwerk RSDFPN vorgeschlagen, das durch den Aufbau einer maßstabsbewussten semantischen Pyramide und eines dynamischen Merkmalsfusionsmechanismus die Fähigkeit des Modells zur Merkmalsfusion über mehrere Skalen hinweg signifikant verbessert. Schließlich wird durch dynamische Gruppenkonvolution und die globale Modellierungsfähigkeit des Transformers eine effiziente Merkmalsverstärkung im Raum und eine Kontextfusion im Frequenzbereich erreicht, wodurch die Erkennungsgenauigkeit des Modells für Zielobjekte gesteigert wird. Experimentelle Ergebnisse zeigen, dass die vorgeschlagene verbesserte Methode auf den beiden führenden Datensätzen RDD2022 und UAV-PDD2023 signifikante Verbesserungen erzielt, mit einer Steigerung des mAP@0,5-Indikators um 1,9 % bzw. 3,7 % gegenüber der Basismethode, und so eine effektive technische Unterstützung für die Straßenschadensdetektion bietet.

关键词

Straßenschadensdetektion; Echtzeit-Detektions-Transformer; doppeldomäne räumlich-frequenz; kontextgesteuerte Rekonstruktion; dynamische Gruppenkonvolution und kooperatives Optimierungsmodul mit Transformer

阅读全文