نظرا لعدم القدرة على معالجة الفروق بين السحب والخلفية بدقة أثناء دمج بيانات الصور البصرية مع صور الرادار ذات الفتحة الاصطناعية (SAR) ، يقدم هذا البحث شبكة إزالة السحب المجموعة SAR والصور البصرية باستخدام هيكل فرعي مزدوج. في مرحلة استخراج السمات ، يتم إدخال آلية الانتباه متعددة المقاييس ، والتي تلتقط بشكل فعال المعلومات العامة والمحلية في الصورة ، لتقديم تمثيلات للمعلومات ذات أهمية أكبر للدمج وإزالة السحب في المراحل التالية. إعادة تصميم بنية الدمج المحلي وفرع الاختلاف والتوازن الديناميكي بينها من خلال آلية البوابة ، واستغلال إسهام كل منهما بالكامل ، وجعل حواف سحب الصورة البصرية المتعلقة بالسحب أكثر تكريسا ، مما يؤدي إلى استعادة صور بصرية خالية من السحب بشكل أدق. باستخدام Swin Transformer المعزز بالموقع الحسي ، يتم ربط الميزات المحلية بشكل كثيف ، مما يجعل النموذج الشبكي يتمتع بمزيد من المتانة في مواجهة البيئات المعقدة. يظهر نموذج الذروة إشارة إلى الضوضاء (PSNR) ومؤشر التشابه الهيكلي (SSIM) أعلى بمقدار 0.833 1 ديسيبل و 0.024 6 على التوالي بالمقارنة مع أفضل خوارزمية حالية. تثبت هذه الدراسة أن الخوارزمية المقدمة لديها أداء أفضل في مهمة إزالة السحب الصور مقارنة بالأساليب الأخرى.
关键词
صور البعيد; صور الرادار ذات الفتحة الاصطناعية; صور بصرية; متعدد الوسائط; دمج البيانات; إزالة السحب