Multi-layer multi-feature adaptive weight fusion network for 3D reconstruction of objects with high-frequency information

WANG Biao ,  

LI Ying ,  

RONG Baichuan ,  

LIU Jing ,  

ZHANG Jin ,  

WANG Yonghong ,  

摘要

لحل مشكلة فقدان معلومات التردد العالي للنماذج في عملية إعادة بناء الأسطح السطحية للكائنات من خلال تعلم العمق الضوئي، تم اقتراح شبكة إعادة بناء ثلاثية الأبعاد معتدلة متعددة المستويات والأوزان للسمات (MMF-Net). تعتمد الشبكة بشكل أساسي على نموذج PS-FCN كنموذج قياسي، حيث تم إدخال هيكل الترميز-فك التناظري لتعزيز قدرة الشبكة على التعلم وتمثيل السمات، مما يعزز قدرتها على دمج السمات بين مستويات مختلفة. كما تم تصميم طبقة تكون الأوزان للتكيف الذاتي متعددة الأشكال بشكل مستقل، من خلال زيادة الأوزان التدريبية الإضافية، مع مراعاة المعلومات الشكلية ومعلومات النسيج، والقدرة على التقاط تفاصيل التغييرات في النسيج السطحي بشكل أفضل، مما يجعل الشبكة تظهر أداءً أكثر استقرارًا ودقة في المشاهد التي تحتوي على معلومات عالية التردد. وتساهم الاتصالات القافزة المضافة في تعزيز السمات ذات التردد العالي وتعزيز المعلومات ذات التردد المنخفض من خلال توصيل السمات الوسيطة بين مستويات لاحقة، للحفاظ على معلومات الكائنات ذات التردد العالي وتعزيز المعلومات ذات التردد المنخفض، من أجل تحقيق تطبيقات دمج المعلومات ذات التردد العالي والمنخفض. تم إجراء اختبارات ذات صلة باستخدام مجموعة بيانات DiLiGenT القياسية، وأظهرت نتائج التجربة أن MMF-Net يمكن أن يحقق خطأ MAE متوسطًا يبلغ 6.94 درجة، وهو تطور بنسبة 6% مقارنة بـ PS-FCN (Norm) الذي يبلغ 7.39 درجة. وكان خطأ إعادة البناء المتوسط لاثنين من الكائنات التي تحتوي على معلومات عالية التردد يبلغ 11.03 درجة، وهو تطور بنسبة 12% مقارنة بالطريقة السابقة FUPS-Net والتي تبلغ 12.52 درجة. نجح MMF-Net في الحصول على معلومات الكائنات ذات تردد منخفض ومرتفع لأسطح الكائنات عن طريق الضوء الثلاثي، وذلك كمرجع لإعادة البناء ثلاثية الأبعاد للكائنات بدقة عالية.

关键词

deep learning;photometric stereo vision;multivariate convolution;feature fusion;adaptive weighting

阅读全文