Para enfrentar o problema da degradação da capacidade de percepção em condução autônoma causada por variações de iluminação e interferências multimodais em cenários de trânsito complexos, propõe-se uma rede de fusão de imagens infravermelhas e visíveis baseada em orientação adaptativa de confiabilidade. Este método constrói um mecanismo de medição de confiabilidade a nível de pixel, modelando conjuntamente a consistência estrutural e anomalias de intensidade para avaliar dinamicamente a confiabilidade da fonte de sinal. Em nível global, adota a estratégia de "injeção confiável" para corrigir a distribuição da intensidade, enquanto no nível de detalhes utiliza filtragem guiada adaptativa para um reforço competitivo entre objetos significativos e texturas, combinada com uma função de perda multi-restrição para otimização colaborativa. Resultados experimentais nos conjuntos de dados M3FD e RoadScene mostram que, em comparação com algoritmos populares como DWT, GTF, U2Fusion e Umcfuse, este método melhora em média a entropia da informação, desvio padrão, frequência espacial, gradiente médio, informação mútua, qualidade da fusão, intensidade das bordas e fidelidade da informação visual em 1,51%, 16,56%, 42,36%, 52,24%, 38,28%, 80,51%, 21,4% e 17,6%, respectivamente; na tarefa de detecção de objetos downstream, a precisão média atingiu 91,4%, superando outros métodos de fusão. Este método suprime eficazmente artefatos e ruído, possui excelente generalização e estabilidade em cenários, e pode melhorar significativamente a precisão da percepção ambiental dos sistemas de condução autônoma.
关键词
fusão de imagem; infravermelho e visível; orientação adaptativa de confiabilidade; consistência estrutural multimodal; injeção confiável; percepção em condução autônoma