Segmentação semântica de ruas urbanas com percepção global e fusão de características multiescala

WU Kaijun ,  

ZHANG Zhirui ,  

WANG Ying ,  

AN Liwei ,  

摘要

A segmentação semântica desempenha um papel insubstituível em aplicações de direção autônoma e engenharia de transporte inteligente. Para enfrentar os problemas de precisão insuficiente causados por bordas de segmentação desfocadas, sobreposição entre objetos e diferenças multiescala entre os objetos, foi proposto uma rede de segmentação semântica de ruas urbanas que integra percepção global e fusão de características multiescala. Para melhorar o problema das bordas desfocadas, foi projetado um módulo de percepção global que aprimora a interação entre características combinando informações espaciais e de canais para captar informações globais; em situações de sobreposição entre objetos, o modelo precisa aumentar a sensibilidade nas áreas ocultas, por isso foi proposto um módulo de fusão de características multiescala para equilibrar a precisão de segmentação de objetos grandes e pequenos; uma perda de suavização de características com múltiplas restrições foi adotada para avaliar o modelo, promovendo um maior suavização das características e otimizando o objetivo para alcançar a solução ótima. Experimentos confirmaram que o método proposto aumentou o valor de mIoU no conjunto de dados Cityscapes em diferentes resoluções em 0,5%, 0,9% e 1,7%, e no conjunto de dados ADE20K em 2,1%. Em comparação com os modelos atuais de redes de segmentação semântica, o método proposto apresenta melhorias adicionais na segmentação.

关键词

aprendizado profundo;processamento de imagem;segmentação semântica;fusão de características;função de perda

阅读全文