Dans des scènes denses, la précision du détecteur diminue en raison de l’occultation du corps des piétons et des différentes échelles des piétons. Cependant, la tête des piétons est souvent moins occultée, ce qui peut être utilisé pour aider à la détection. À cet égard, un algorithme de détection de piétons basé sur la combinaison des informations de la tête et de l’ensemble du corps a été proposé. Tout d’abord, un réseau d’extraction de caractéristiques basé sur des connexions denses et une fusion renforcée a été conçu pour renforcer l’extraction des caractéristiques multi-échelles et améliorer la sensibilité du réseau à la détection des piétons à différentes échelles. Ensuite, le mécanisme d’échantillonnage du réseau de proposition de régions a été optimisé, et une stratégie d’extraction d’échantillons difficiles non uniforme basée sur le taux de recouvrement de l’occultation a été proposée, portant une attention particulière aux échantillons difficiles fortement occultés afin d’améliorer l’adaptabilité du réseau aux occultations. Puis, une stratégie de détection conjointe de la tête et du corps entier a été construite et la phase de post-traitement a été optimisée en utilisant les résultats de détection de la tête pour restaurer les boîtes de détection globales erronément supprimées en raison de l’occultation, réduisant ainsi le taux de détection manquée. Parallèlement, la fonction de perte a été optimisée en fonction des caractéristiques du cadre conjoint de détection, atténuant davantage les erreurs de détection et les détections manquées causées par l’occultation. Enfin, l’efficacité de l’algorithme proposé a été vérifiée expérimentalement. Les résultats montrent que l’algorithme réduit le taux moyen logarithmique de détection manquée de 5,7% et améliore la précision moyenne de 4% sur le jeu de données CrowdHuman à haute occultation, et réduit respectivement de 2,4% et 2,1% le taux moyen logarithmique de détection manquée sur deux sous-ensembles à petite échelle du jeu de données TJU-DHD-pedestrian, améliorant ainsi efficacement la capacité de détection des piétons occultés et multi-échelles.
关键词
Détection de piétons; détection conjointe; fusion des caractéristiques multi-échelles; extraction d’échantillons difficiles; optimisation du post-traitement