Для решения проблемы недостаточной точности обнаружения, вызванной значительными различиями в масштабе объектов и сложным распределением направлений в задачах обнаружения целей на дистанционно управляемых изображениях, предложена сеть обнаружения, объединяющая информацию о фоне и направлении. Во-первых, для проблемы значительных различий масштабов объектов разработан модуль расширения рецептивного поля (Receptive Field Extending, RFE). В отличие от традиционного фиксированного рецептивного поля или сложных многоветвевых структур, этот модуль с помощью разложения больших ядер, разреженных сверточных операций и параллельной структуры ветвей объединяет много масштабную фоновую информацию без значительного увеличения вычислительной нагрузки, решая проблему различной потребности объектов разных масштабов в фоновом контексте. Во-вторых, для проблемы сложного распределения направлений объектов создан модуль внимания с учетом направления (Orientation Aware Cross Attention, OACA). В отличие от существующих форм ядер сверток в механизмах внимания, этот модуль извлекает информацию о текстуре направления с помощью горизонтальных и вертикальных сепарабельных сверток, предотвращая потерю и разрыв признаков; также разработан механизм перекрестного внимания, подавляющий фоновый шум и усиливающий взаимодействие направленной информации. Экспериментальные результаты показывают, что предложенный метод достигает точности обнаружения 76,88%, 98,43% и 65,06% на наборах данных DOTA, HRSC2016 и DIOR-R соответственно, что на 1,01%, 0,83% и 0,76% лучше метода Oriented R-CNN, дополнительно подтверждая эффективность совместного использования фоновой и направленной информации.
关键词
Дистанционно управляемые изображения; Обнаружение повёрнутых целей; Расширение рецептивного поля; Внимание с учётом направления