Frente a los problemas de insuficiencia de datos de referencia y baja precisión de interpretación en la tarea de extracción de barcos a nivel de píxel en imágenes de teledetección, este artículo realiza una investigación en dos niveles: conjunto de datos y estructura de red. Se construyó un conjunto de datos de segmentación semántica de barcos (Ship Semantic Segmentation Dataset, SSSD) que es abundante, diverso y ampliamente distribuido, y se propuso un método de extracción de barcos basado en tareas duales conjuntas y un mecanismo dual de atención. A nivel del conjunto de datos, se seleccionaron razonablemente áreas portuarias a nivel mundial y se construyó el SSSD sobre la base del conjunto de datos HRSC2016, conteniendo finalmente 3,760 imágenes de entrenamiento y 923 de prueba. A nivel de la estructura de la red, mediante la fusión de atención propia múltiple y atención de canales se diseñó un mecanismo dual de atención que mejoró eficazmente la precisión de la segmentación. Además, se introdujo una rama de supervisión de contorno como tarea auxiliar, formando un marco de red de tareas duales conjuntas con la segmentación semántica que mejoró el recorte de barcos y fondo. Los resultados experimentales indican que el método propuesto mejora el IoU en un 11.44 %, 17.84 %, 12.25 % y 1.64 % respecto a U-Net, ASPPUNet, DeepLabV3+ y MANet respectivamente; el diseño del mecanismo dual de atención y las tareas auxiliares aumentaron el IoU en 2.02 % y 1.36 % respectivamente; al mismo tiempo, en experimentos de generalización, el método mostró una mayor adaptabilidad y robustez. El SSSD construido puede proporcionar una base de datos confiable para la interpretación de barcos a nivel píxel, y el método de extracción propuesto ofrece mejor rendimiento, estabilidad y capacidad de generalización en comparación con métodos convencionales.
关键词
imágenes de teledetección;extracción de barcos;conjunto de datos;mecanismo de atención;tareas duales