SPMRA-Net : Restauration d'images fortement endommagées par agrégation résiduelle multi-échelle avec prior structurel

WEI Yun ,  

JIA Baixue ,  

Feng Dandan ,  

ZHANG Zhirui ,  

XIN Zihao ,  

WU Tongchen ,  

摘要

Pour résoudre les problèmes de flou de texture, de distorsion de structure et d'artefacts de bordure dans la restauration d'images fortement endommagées de visages, de scènes de rue, de bâtiments, etc., cet article propose une méthode appelée SPMRA-Net pour la restauration d'images à grande échelle. Tout d'abord, un module dynamique multi-échelle adaptatif (Dynamic Adaptive Multi-scale, DAM) est conçu, qui renforce la capacité de la modélisation contextuelle grâce aux convolutions à trous et aux structures résiduelles ; ensuite, un module goulot d'étranglement composé d'un chemin Transformer et d'un chemin d'attention sémantique cohérente est construit, et grâce à un mécanisme d'attention croisée, les informations sémantiques globales extraites du chemin Transformer sont fusionnées avec les informations texturales locales du chemin d'auto-attention, ce qui supprime efficacement les distorsions de structure dans les scènes avec de grandes zones manquantes ; par ailleurs, pour atténuer le problème des écarts sémantiques causés par la simple concaténation dans les connexions par saut traditionnelles, un module d'agrégation multi-échelle adaptatif (Adaptive Multi-scale Aggregation, AMSA) est introduit pour améliorer l'interaction entre les caractéristiques profondes et superficielles, garantissant la continuité des bords de l'image restaurée. Enfin, deux discriminateurs sont introduits pour évaluer la cohérence entre les résultats restaurés et les images originales afin d'améliorer le réalisme perceptuel des images générées. Les résultats expérimentaux montrent que ce modèle améliore le PSNR de 3,06 dB, le SSIM de 0,087 et réduit le LPIPS de 0,078 sur le jeu de données CelebA. Les évaluations subjectives sur les datasets Paris StreetView et Places2, ainsi que les métriques objectives mentionnées ci-dessus, surpassent les algorithmes de référence. Cette méthode améliore à la fois la cohérence structurelle et la perception, prouvant son efficacité dans la restauration d’images à grande échelle.

关键词

apprentissage profond; restauration d'image; réseaux antagonistes génératifs; résidus multi-échelles; prior structurel; Transformer

阅读全文