Улучшенный вариант семантической сегментационной сети DeepLabv3+ с механизмом внимания

YAN He ,  

LEI Qiuxia ,  

WANG Xu ,  

摘要

Учитывая высокую вычислительную сложность семантической сегментационной сети DeepLabv3+ и слабую способность извлечения деталей изображения и размытость границ изображения, был предложен улучшенный вариант семантической сегментационной сети DeepLabv3+ с механизмом внимания. Используя легковесную сеть MobileNetV2 как основу, значительно уменьшено количество параметров модели при сохранении высочайшей репрезентативности. Рядом с низкоуровневой особенностью основной сети был добавлен легковесный, без параметров механизм внимания (Simple, Parameter-Free Attention Module, SimAM) для взвешивания входной особенности с целью улучшения способности извлечения ключевых особенностей. Глобальное среднее пулирование модуля ASPP было заменено на снижение с помощью малой вейвлет-трансформации Хаара (Haar Wavelet Downsampling, HWD) с целью избежания потери пространственной информации, а также после модуля ASPP был добавлен внешний механизм внимания (External Attention, EANet) для лучшего использования контекстуальной информации с целью воплощения много-масштабного слияния и, таким образом, улучшения способности понимания семантики и точности семантической сегментации. Результаты эксперимента показали, что эта модель улучшила средний показатель объединения (mIoU) на наборе данных VOC2012 по сравнению с исходной семантической сегментационной моделью DeepLabv3+ на 2,82%. Предложенная в данной статье улучшенная модель значительно повысила точность семантической сегментации модели и предложила новую схему для применения в области компьютерного зрения.

关键词

Семантическая сегментация; DeepLabV3+; Снижение с помощью малой вейвлет-трансформации Хаара; Внешний механизм внимания; Много-масштабное слияние

阅读全文