Para abordar el problema de la insuficiente precisión en la detección de objetivos en imágenes de teledetección debido a grandes diferencias en la escala de los objetivos y una distribución compleja de direcciones, se propone una red de detección que fusiona información de fondo e información direccional. En primer lugar, para el problema de la gran diferencia en la escala de los objetivos, se diseñó un módulo de extensión del campo receptivo (Receptive Field Extending, RFE). A diferencia de los campos receptivos fijos tradicionales o las arquitecturas complejas con múltiples ramas, este módulo integra información de fondo multiescala mediante la descomposición de núcleos grandes, convoluciones dilatadas y una estructura de ramas en paralelo, sin aumentar significativamente la carga computacional, resolviendo las diferencias en las demandas de información de fondo para objetivos de distintas escalas. En segundo lugar, para el problema de la compleja distribución direccional de los objetivos, se diseñó un módulo de atención cruzada consciente de la orientación (Orientation Aware Cross Attention, OACA). A diferencia de la forma del núcleo convolucional en los mecanismos de atención existentes, este módulo extrae información de textura direccional mediante convoluciones separables horizontales y verticales para evitar la pérdida y ruptura de características; además, se diseñó un mecanismo de atención cruzada para suprimir el ruido de fondo y reforzar la interactividad de la información direccional. Los resultados experimentales muestran que el método propuesto alcanza una precisión de detección del 76.88%, 98.43% y 65.06% en los conjuntos de datos DOTA, HRSC2016 y DIOR-R respectivamente, mejorando en 1.01%, 0.83% y 0.76% en comparación con el método Oriented R-CNN, validando además la efectividad de la cooperación entre la información de fondo y la información direccional.
关键词
Imágenes de teledetección; Detección de objetivos rotados; Extensión del campo receptivo; Atención cruzada consciente de la orientación