Para resolver o problema da baixa precisão de detecção causada pela grande diferença de escala dos alvos e pela distribuição complexa de direções na detecção de alvos em imagens de sensoriamento remoto, propomos uma rede de detecção que integra informações de fundo e informações de direção. Primeiramente, para o problema da grande diferença de escala dos alvos, foi projetado um módulo de extensão do campo receptivo (Receptive Field Extending, RFE). Diferentemente dos campos receptivos fixos tradicionais ou das estruturas complexas com múltiplos ramos, este módulo integra informações de fundo em múltiplas escalas por meio da decomposição de grandes núcleos, convoluções dilatadas e uma estrutura de ramos paralelos, sem aumentar significativamente o custo computacional, resolvendo as diferenças na necessidade de informações de fundo para alvos de diferentes escalas. Em segundo lugar, para o problema da distribuição complexa das direções dos alvos, foi projetado um módulo de atenção cruzada consciente da orientação (Orientation Aware Cross Attention, OACA). Diferentemente da forma do núcleo convolucional nos mecanismos de atenção existentes, este módulo extrai informações de textura direcional por meio de convoluções separáveis horizontais e verticais para evitar a perda e ruptura de características; ao mesmo tempo, foi projetado um mecanismo de atenção cruzada para suprimir o ruído de fundo e fortalecer a interatividade das informações direcionais. Os resultados experimentais mostram que o método proposto alcança precisão de detecção de 76,88%, 98,43% e 65,06% nos conjuntos de dados DOTA, HRSC2016 e DIOR-R, respectivamente, melhorando em 1,01%, 0,83% e 0,76% em comparação com o método Oriented R-CNN, validando ainda a eficácia da sinergia entre informações de fundo e informações direcionais.
关键词
Imagens de sensoriamento remoto; Detecção de alvos rotacionados; Extensão do campo receptivo; Atenção cruzada consciente de orientação