La refracción y dispersión de la luz en el agua, junto con la iluminación desigual, causan que la textura del objetivo se vuelva borrosa. Los organismos acuáticos suelen ser pequeños objetivos densamente camuflados, y las plataformas submarinas con recursos limitados tienen restricciones en cuanto a ligereza y capacidad en tiempo real, lo que agrava aún más la dificultad en la detección de objetivos submarinos. Para ello, este artículo propone un modelo mejorado de YOLOv8n con atención automática de cabeza única y fusión en dominio frecuencia-espacial, YOLOv8n-SD. Primero, se diseñó una red troncal mejorada con fusión de características locales y globales, mediante un mecanismo de atención automática de cabeza única que divide dinámicamente la proporción de canales, extrayendo eficientemente la información global de largo alcance en algunas partes de los canales; además, se integran las características locales extraídas por bloques eficientes, logrando un fortalecimiento complementario entre características locales y globales. Luego, se construyó una red de cuello de fusión eficiente en dominio frecuencia-espacial, diseñando un módulo de muestreo descendente basado en la transformación wavelet Haar y la transformación de espacio a profundidad, fusionando información espacial y de alta frecuencia importante en características de alta resolución y baja capa; al mismo tiempo, se adopta una estrategia de ponderación normalizada rápida para optimizar dinámicamente la eficiencia de fusión multi-escala. En los conjuntos de datos públicos submarinos URPC2020 y RUOD, los indicadores mAP0.5∶0.95 y mAP50 de YOLOv8n-SD alcanzaron 51.2%, 85.7% y 50.6%, 85.0% respectivamente. Además, la cantidad de parámetros del modelo base se redujo en un 42.3%, y la carga computacional disminuyó en un 17.2%. Los experimentos comparativos confirmaron aún más que el modelo propuesto muestra una buena precisión y robustez en escenarios submarinos complejos.
关键词
detección de objetivos submarinos;mecanismo de atención automática;transformación wavelet Haar;detección de objetos pequeños