A segmentação semântica desempenha um papel insubstituível em aplicações de direção autônoma e engenharia de transporte inteligente. Para enfrentar os problemas de precisão insuficiente causados por bordas de segmentação desfocadas, sobreposição entre objetos e diferenças multiescala entre os objetos, foi proposto uma rede de segmentação semântica de ruas urbanas que integra percepção global e fusão de características multiescala. Para melhorar o problema das bordas desfocadas, foi projetado um módulo de percepção global que aprimora a interação entre características combinando informações espaciais e de canais para captar informações globais; em situações de sobreposição entre objetos, o modelo precisa aumentar a sensibilidade nas áreas ocultas, por isso foi proposto um módulo de fusão de características multiescala para equilibrar a precisão de segmentação de objetos grandes e pequenos; uma perda de suavização de características com múltiplas restrições foi adotada para avaliar o modelo, promovendo um maior suavização das características e otimizando o objetivo para alcançar a solução ótima. Experimentos confirmaram que o método proposto aumentou o valor de mIoU no conjunto de dados Cityscapes em diferentes resoluções em 0,5%, 0,9% e 1,7%, e no conjunto de dados ADE20K em 2,1%. Em comparação com os modelos atuais de redes de segmentação semântica, o método proposto apresenta melhorias adicionais na segmentação.
关键词
aprendizado profundo;processamento de imagem;segmentação semântica;fusão de características;função de perda