RSF-DETR: Detección de daños en la superficie de la carretera mediante refuerzo espacial-frecuencia y reconstrucción contextual

ZHOU Dongmei ,  

WU Bingbing ,  

LIU Xiaoming ,  

YAN Haowen ,  

WU Xiaosuo ,  

摘要

Ante la diversidad de formas de daño en la superficie de la carretera, la baja precisión de detección y la alta tasa de omisión, este artículo propone un método mejorado basado en el modelo RT-DETR. Primero, basado en la idea conjunta de realce de bordes de alta frecuencia en el dominio espacial y extracción de características globales en el dominio de frecuencia, se diseñó el módulo de mejora de características de doble dominio espacial-frecuencia FreSCal, que mejora la capacidad del modelo para extraer información del objetivo y de los bordes, y mejora la capacidad para distinguir entre la región objetivo y el fondo. En segundo lugar, tomando como referencia la idea de reconstrucción de características guiada por el contexto de la red CGRSeg, se propone la red de pirámide de reconstrucción de características espaciales guiada por contexto RSDFPN, que a través de la construcción de una pirámide semántica consciente de la escala y un mecanismo dinámico de fusión de características, mejora significativamente la capacidad del modelo para fusionar características de múltiples escalas. Finalmente, mediante la convolución grupal dinámica mezclada y la capacidad de modelado global del Transformer, se logra un refuerzo eficiente de características en el dominio espacial y una fusión contextual en el dominio de frecuencia, mejorando la precisión de detección del reconocimiento de objetivos del modelo. Los resultados experimentales muestran que el método mejorado en este artículo logra mejoras significativas en los conjuntos de datos principales RDD2022 y UAV-PDD2023, con un aumento en el indicador mAP@0.5 del 1,9 % y 3,7 % respectivamente en comparación con el método base, que puede proporcionar un soporte técnico eficaz para la detección de daños en la superficie de la carretera.

关键词

detección de daños en la superficie de la carretera; Transformer de detección en tiempo real; doble dominio espacial-frecuencia; reconstrucción guiada por contexto; convolución grupal dinámica mezclada y módulo de optimización colaborativa con Transformer

阅读全文