Para abordar el problema de la escala única en la extracción de características, la pérdida de detalles y los bordes borrosos en la segmentación semántica de imágenes aéreas, este artículo propone una red de segmentación semántica de imágenes aéreas con interacción entre niveles y percepción de orientación. Mediante una estrategia de atención con desacoplamiento direccional se construye un módulo de percepción de orientación que mejora la capacidad del modelo para procesar información direccional espacial; se diseña un módulo de interacción entre niveles para la fusión interactiva de características entre canales, mejorando la percepción espacial, y se utiliza un mecanismo de atención canal-espacio para aumentar la capacidad de extracción de características y aliviar los problemas de desenfoque de detalles en escenas complejas; finalmente, se realiza un diseño ligero para la cabeza de segmentación, eliminando operaciones redundantes, reduciendo la carga computacional y garantizando el rendimiento de segmentación. Los resultados experimentales muestran que la red propuesta mejoró el índice medio de intersección sobre unión en los conjuntos de datos UAVid y Aeroscapes en un 1,7 % y un 1,3 % respectivamente en comparación con el modelo base SegFormer, demostrando la efectividad de la red en situaciones complejas como las imágenes aéreas. La clase Human mostró una mejora en la precisión de segmentación del 1,8 % en comparación con el modelo base, demostrando un excelente desempeño en la segmentación de pequeños objetivos. En comparación con varias redes principales, este método logró la mayor precisión de segmentación en ambos conjuntos de datos, mostrando mejor capacidad de generalización.
关键词
interacción entre niveles;segmentación semántica;imágenes aéreas;ligereza;desacoplamiento direccional