Para resolver os problemas de escala única na extração de características, perda de detalhes e bordas borradas na segmentação semântica de imagens aéreas, este artigo propõe uma rede de segmentação semântica de imagens aéreas com interação entre níveis e percepção de orientação. Por meio de uma estratégia de atenção de desacoplamento direcional, é construído um módulo de percepção de orientação para melhorar a capacidade do modelo de processar informações direcionais espaciais; um módulo de interação entre níveis é projetado para realizar a fusão interativa de características entre canais, aumentando a percepção espacial, enquanto um mecanismo de atenção canal-espaço é utilizado para melhorar a capacidade de extração de características e aliviar problemas de desfoque de detalhes em cenas complexas; por fim, a cabeça de segmentação é projetada de forma leve, removendo operações redundantes, reduzindo o custo computacional e garantindo o desempenho da segmentação. Os resultados experimentais mostram que a rede proposta melhorou a média da interseção sobre união (IoU) nos conjuntos de dados UAVid e Aeroscapes em 1,7% e 1,3%, respectivamente, em comparação com o modelo base SegFormer, comprovando a eficácia da rede em situações complexas como imagens aéreas. A classe Human apresentou uma melhora de 1,8% na precisão da segmentação em relação ao modelo base, demonstrando excelente desempenho na segmentação de pequenos alvos. Comparado a várias redes principais, este método alcançou a maior precisão de segmentação em ambos os conjuntos de dados, mostrando melhor capacidade de generalização.
关键词
interação entre níveis;segmentação semântica;imagens aéreas;leveza;desacoplamento direcional