Pour résoudre le problème des capacités limitées d'expression des caractéristiques et du manque de robustesse des modèles de segmentation traditionnels lors du traitement d'arrière-plans complexes ou de zones de défauts microscopiques sur les engrenages, cet article propose un réseau de segmentation basé sur la fusion de caractéristiques multi-échelles et l'attention par blocs afin d'améliorer la capacité de représentation des caractéristiques visuelles des engrenages et la performance de détection des petits défauts. Tout d'abord, un module d'enrichissement multi-échelles remplace le module de sous-échantillonnage standard de l'encodeur UNet, utilisant une structure convolutionnelle parallèle à branches multiples pour extraire conjointement des caractéristiques multi-échelles et multi-directions, renforçant la perception des détails locaux et du contexte global; ensuite, après le sous-échantillonnage, un module d'attention par blocs est introduit, utilisant un mécanisme d'attention multi-têtes par blocs pour analyser indépendamment les zones locales, augmentant significativement la sensibilité du modèle aux micro-défauts et aux différences de textures locales; enfin, une fonction de perte conjointe pondérée est conçue, combinant la perte Dice, la perte BCE et des contraintes sur la différence de gradient, afin d'atténuer le problème du déséquilibre des classes et d'optimiser la qualité des contours de segmentation. Les résultats expérimentaux sur des jeux de données publics et privés de défauts d'engrenages montrent que le modèle proposé surpasse UNet et d'autres modèles avancés pour les tâches de segmentation de plusieurs types de défauts d'engrenages, avec des précisions respectives de 91,27% et 85,88%. Cette méthode est efficace et en temps réel pour la détection précise des défauts de surface d'engrenages.
关键词
Détection des défauts de surface;Segmentation d'image;UNet;Attention par blocs;Engrenage