Para abordar os problemas dos algoritmos existentes de detecção de anomalias industriais, como baixa precisão na detecção de defeitos de pequeno porte, fraca capacidade de extração de características multiescala e baixa precisão na segmentação de anomalias, propõe-se uma rede de detecção de anomalias industriais que combina a orientação por resíduos de alta frequência e a fusão de características multiescala com atenção. Primeiramente, para o problema da perda de detalhes de alta frequência causada pelo processamento tradicional de toda a frequência, foi projetada uma estratégia de separação no domínio da frequência, utilizando um filtro de núcleo Gaussiano para extrair características residuais de alta frequência, fortalecendo a capacidade da rede para detectar pequenas anomalias; em segundo lugar, para resolver a insuficiente capacidade das redes convolucionais convencionais em representar texturas complexas e a baixa distinção entre anomalias e fundo, foi incorporado um módulo de atenção multiescala com reforço global GEMA na fase de codificação da rede discriminadora, capturando paralelamente informações locais multiescala nas direções horizontal e vertical, fortalecendo características distintas em diferentes posições espaciais e melhorando a discriminação de características em fundos texturizados complexos; finalmente, na fase de decodificação da rede discriminadora, integrou-se um módulo de atenção de coordenadas CoordAtt, que, ao decompor os eixos de coordenadas, modula dinamicamente os pesos das características, alcançando uma localização espacial precisa das áreas anômalas. Experimentos demonstram que no conjunto de dados público MVTec AD, o modelo aprimorado alcança uma média de AUROC em nível de imagem de 98,6%, e médias de AUROC e AP em nível de pixel de 97,6% e 73,2%, respectivamente, melhorando efetivamente a eficácia da detecção de anomalias industriais.
关键词
Detecção de anomalias industriais; orientação por componentes de alta frequência; percepção espacial multiescala; mecanismo de atenção