في مهمة استخراج السفن على مستوى بكسل من الصور الاستشعارية عن بعد، حيث توجد مشاكل مثل نقص البيانات المرجعية وضعف دقة التفسير، تجرى هذه الورقة بحثًا على مستويين هما مجموعة البيانات وبنية الشبكة. تم بناء مجموعة بيانات تقطيع دلالي للسفن (Ship Semantic Segmentation Dataset، SSSD) تحتوي على كمية كافية وأنواع غنية وتوزيع واسع، بالإضافة إلى اقتراح طريقة استخراج السفن باستخدام مهام مزدوجة مشتركة وآلية انتباه مزدوجة. على مستوى مجموعة البيانات، تم اختيار مناطق الموانئ عالميًا بشكل عقلاني، وتم بناء SSSD استنادًا إلى مجموعة بيانات HRSC2016، حيث تحتوي المجموعة النهائية على 3760 صورة تدريبية و923 صورة اختبار. على مستوى بنية الشبكة، تم تصميم آلية انتباه مزدوجة من خلال دمج الانتباه الذاتي متعدد الرؤوس وانتباه القناة، مما حسن دقة التقطيع بشكل فعال. علاوة على ذلك، تم تقديم فرع إشراف على المحيط كمهمة مساعدة، مما شكل إطار شبكة ذو مهام مزدوجة لتحسين فصل السفن عن الخلفية. أظهرت النتائج التجريبية أن الطريقة المقدمة حسنت مؤشر IoU عن U-Net، ASPPUNet، DeepLabV3+ وMANet بنسبة 11.44٪، 17.84٪، 12.25٪ و1.64٪ على التوالي؛ وبلغ التحسن بفضل آلية الانتباه المزدوجة والمهام المساعدة 2.02٪ و1.36٪ على التوالي؛ كما أظهرت الطريقة أيضًا قابلية تعميم أقوى ومتانة في تجارب التعميم. يمكن لمجموعة البيانات SSSD التي تم إنشاؤها في هذه الورقة أن توفر قاعدة بيانات موثوقة لتفسير السفن على مستوى البكسل، والطريقة المقترحة للتقطيع تقدم أداءً أفضل واستقرارًا وقابلية تعميم أقوى مقارنةً بالطرق السائدة.
关键词
الصور الاستشعارية عن بعد;استخراج السفن;مجموعة البيانات;آلية الانتباه;مهام مزدوجة