Для решения проблемы одноуровневого масштаба извлечения признаков, потери деталей и размытости границ в семантической сегментации аэрофотоснимков, в статье предлагается сеть семантической сегментации аэрофотоснимков с межуровневым взаимодействием и ориентационным восприятием. С помощью стратегии внимания с разложением направлений создается модуль ориентационного восприятия, который усиливает способность модели обрабатывать пространственную направленную информацию; разработан модуль межуровневого взаимодействия для межканального взаимодействия признаков, повышающий пространственное восприятие, при этом используется механизм внимания канал-пространство для усиления извлечения признаков и уменьшения размытия деталей в сложных сценах; в конце голова сегментации сделана легковесной, удалены избыточные операции, что снижает вычислительную нагрузку при сохранении производительности. Результаты экспериментов показывают, что предложенная сеть улучшила средний индекс пересечения по объединению на наборах данных UAVid и Aeroscapes на 1.7% и 1.3% соответственно по сравнению с базовой моделью SegFormer, что доказывает эффективность сети при сложных условиях аэрофотосъемки. Точность сегментации класса «Человек» повысилась на 1.8% по сравнению с базовой моделью, показывая хорошую производительность сети в сегментации мелких объектов. По сравнению с несколькими основными сетями данный метод достиг наивысшей точности сегментации на двух наборах данных, демонстрируя лучшую способность к обобщению.
关键词
межуровневое взаимодействие;семантическая сегментация;аэрофотоснимки;легковесность;разложение направления