RSF-DETR : détection des dommages de la chaussée par renforcement spatial-fréquentiel et reconstruction contextuelle

ZHOU Dongmei ,  

WU Bingbing ,  

LIU Xiaoming ,  

YAN Haowen ,  

WU Xiaosuo ,  

摘要

Face à la diversité des formes de dommages de la chaussée, à la faible précision de détection et au taux élevé de faux négatifs, cet article propose une méthode améliorée basée sur le modèle RT-DETR. Tout d'abord, basée sur l'idée conjointe de renforcement des contours haute fréquence dans le domaine spatial et d'extraction des caractéristiques globales dans le domaine fréquentiel, un module d'amélioration des caractéristiques dans les doubles domaines spatial et fréquentiel nommé FreSCal a été conçu, renforçant la capacité du modèle à extraire les informations de l'objet et des contours, tout en améliorant la distinction entre la zone cible et l'arrière-plan. Ensuite, s'inspirant de la reconstruction des caractéristiques guidée par le contexte du réseau CGRSeg, un réseau pyramidal de reconstruction des caractéristiques spatiales guidé par le contexte RSDFPN a été proposé, qui, grâce à la construction d'une pyramide sémantique sensible à l'échelle et à un mécanisme dynamique de fusion des caractéristiques, améliore significativement la fusion des caractéristiques multi-échelles du modèle. Enfin, grâce à la convolution groupée dynamique et la capacité de modélisation globale du Transformer, un renforcement efficace des caractéristiques dans le domaine spatial et une fusion contextuelle dans le domaine fréquentiel sont réalisés, ce qui améliore la précision de détection de la reconnaissance d'objets du modèle. Les résultats expérimentaux montrent que la méthode améliorée proposée dans cet article obtient une amélioration significative sur les deux principaux ensembles de données RDD2022 et UAV-PDD2023, avec une augmentation de l'indicateur mAP@0.5 de 1,9 % et 3,7 % par rapport à la méthode de base, fournissant ainsi un support technique efficace pour la détection des dommages de la chaussée.

关键词

détection des dommages de la chaussée; Transformer de détection en temps réel; double domaine spatial-fréquentiel; reconstruction guidée par le contexte; module d'optimisation collaborative de convolution groupée dynamique et Transformer

阅读全文