La segmentation sémantique joue un rôle indispensable dans les applications de conduite autonome et d'ingénierie des transports intelligents. Pour résoudre les problèmes d'imprécision causés par des frontières de segmentation floues, le recouvrement des objets et les différences d'échelle multiples entre les objets, un réseau de segmentation sémantique pour les routes urbaines intégrant une perception globale et une fusion de caractéristiques multi-échelles est proposé. Pour améliorer le problème des frontières floues, un module de perception globale a été conçu, renforçant l'interaction entre les caractéristiques en combinant les informations spatiales et canaux pour percevoir l'information globale ; en cas de recouvrement entre objets, le modèle doit augmenter la sensibilité aux zones occultées, d'où la proposition d'un module de fusion de caractéristiques multi-échelles pour concilier la précision de segmentation des objets grands et petits ; une perte de lissage des caractéristiques sous contraintes multiples est utilisée pour évaluer le modèle, favorisant un lissage supplémentaire des caractéristiques et optimisant l'objectif pour une solution optimale. Les expériences montrent que la méthode proposée améliore la valeur mIoU de 0,5 %, 0,9 %, 1,7 % à différentes résolutions sur le jeu de données Cityscapes, et de 2,1 % sur le jeu ADE20K. Par rapport aux modèles existants de réseaux de segmentation sémantique, cette méthode améliore davantage les résultats de segmentation.
关键词
apprentissage profond;traitement d'image;segmentation sémantique;fusion de caractéristiques;fonction de perte