Преломление и рассеяние света в воде, а также неравномерное освещение приводят к размытости текстуры цели. Водные организмы часто представляют собой плотные замаскированные мелкие объекты, а ограниченные ресурсы подводных платформ предъявляют требования к легкости и работе в реальном времени, что вместе усложняет задачу подводного обнаружения целей. В связи с этим в статье предложена улучшенная модель YOLOv8n с одноголовой самовнимательностью и частотно-пространственным слиянием — YOLOv8n-SD. Во-первых, разработана усиленная основная сеть с локально-глобальным слиянием признаков, использующая одноголовую самовнимательную механизм с динамическим разделением пропорции каналов для эффективного извлечения долгосрочной глобальной информации по частям каналов; также объединяются локальные детали, извлекаемые эффективными блоками признаков, что обеспечивает взаимное усиление локальных и глобальных признаков. Во-вторых, построена эффективная шейная сеть для частотно-пространственного слияния, спроектирован нисходящий модуль на основе вейвлет-преобразования Хаара и преобразования пространственного в глубинное пространство, позволяющий интегрировать важные высокочастотные и пространственные характеристики из малых слоёв с высоким разрешением; одновременно применяется стратегия быстрой нормализации и взвешивания для динамической оптимизации эффективности многомасштабного слияния признаков. На открытых подводных наборах данных URPC2020 и RUOD модель YOLOv8n-SD достигла показателей mAP0.5∶0.95 и mAP50 соответственно 51,2%, 85,7% и 50,6%, 85,0%. При этом количество параметров модели уменьшилось на 42,3%, вычислительные затраты снизились на 17,2%. Сравнительные эксперименты дополнительно подтвердили, что предложенная модель демонстрирует хорошую точность обнаружения и устойчивость в различных сложных подводных сценариях.
关键词
подводное обнаружение целей;механизм самовнимания;вейвлет-преобразование Хаара;обнаружение мелких объектов