تحسين DeepLabv3+ للشبكة العصبية اللغوية النصية بآلية الانتباه المدمجة

YAN He ,  

LEI Qiuxia ,  

WANG Xu ,  

摘要

نظرًا لتعقيد حساب كثافة DeepLabv3+ للشبكة العصبية اللغوية النصية وضعف قدرتها على استخراج تفاصيل الصورة وضوح حدود الصورة المقسمة، تم اقتراح تحسين DeepLabv3+ للشبكة العصبية اللغوية النصية بآلية الانتباه المدمجة. باستخدام شبكة خفيفة الوزن MobileNetV2 كالهيكل الأساسي، تم تقليل بشكل ملحوظ عدد معلمات النموذج مع الحفاظ على قدرة تمثيل عالية. تمت إضافة آلية الانتباه الخفيفة والخالية من المعلمات (Simple، Parameter-Free Attention Module، SimAM) خلف ميزات الطبقة المنخفضة للشبكة الأساسية لتقوية قدرتها على استخراج الميزات الحاسمة. تم استبدال التجانس العالمي لوحدة ASPP بتحويل هار للموجات الصغيرة (Haar Wavelet Downsampling، HWD) لتجنب فقدان المعلومات المكانية، وفي الوقت نفسه تم إضافة آلية الانتباه الخارجية (External Attention، EANet) بعد وحدة ASPP للاستفادة الأفضل من معلومات السياق وتحقيق دمج متعدد المقياس، مما يعزز قدرة فهم المعنى ودقة الانقسام اللغوي النصي. تظهر نتائج التجربة أن هذا النموذج زاد من متوسط تداخل Union (mIoU) مقارنة بنموذج الانقسام اللغوي النصي الأصلي DeepLabv3+ بنسبة 2.82%. أدى النموذج المحسن الذي اقترحته هذه الورقة إلى تحسين كبير في دقة انقسام اللغوي النصي للنموذج، وقدم مفهومًا جديدًا في مجال رؤية الحاسوب.

关键词

انقسام اللغوي النصي؛ DeepLabV3+؛ تحويل هار للموجات الصغيرة؛ آلية الانتباه الخارجية؛ دمج متعدد المقياس

阅读全文