Détection des points clés des membres inférieurs basée sur la fusion de caractéristiques multi-résolutions

XIA Xiaohua ,  

XIANG Haoming ,  

CHEN Jian ,  

FENG Xinmiao ,  

QIU Fabo ,  

WANG Yaoyao ,  

摘要

Les modèles existants de détection des points clés du corps humain manquent d’attention portée aux caractéristiques à haute résolution. Les ensembles de données utilisés lors de l’entraînement ont une résolution faible et des erreurs d’annotation importantes, ce qui entraîne des résultats instables et une précision de localisation médiocre dans des tâches comme l’analyse de la démarche. Pour résoudre ces problèmes, un modèle de détection des points clés des membres inférieurs basé sur la fusion de caractéristiques multi-résolutions est proposé. Ce modèle prend des images à haute résolution en entrée, utilise un réseau MobileNet v1 affiné combiné à un mécanisme d’attention pour extraire des caractéristiques globales à basse résolution et prédit initialement les positions des points clés. Parallèlement, un réseau peu profond extrait des caractéristiques locales à haute résolution. Ensuite, une structure de résidus continus et un mécanisme d’attention fusionnent les différentes résolutions, améliorant ainsi la précision de la prédiction des points clés tout en atténuant la charge de calcul liée aux images haute résolution. Un jeu de données des points clés des membres inférieurs à haute résolution et haute précision a été créé par une méthode de pré-étiquetage pour garantir la précision de l’entraînement du modèle. Les critères d’évaluation incluent la complexité du modèle, la vitesse de détection, la précision et l’erreur de détection. Les résultats montrent que le modèle proposé atteint un taux de détection de 95,2%, surpassant Lightweight-OpenPose, HRNet-W32, HRNet-W48, YOLO-Pose, RTMPose et SimCC, avec une amélioration de la précision de 4,1 % à 83,6 % et une augmentation du FPS de 7,6 à 13,9. Cela démontre l’efficacité du modèle proposé pour la détection précise des points clés des membres inférieurs humains.

关键词

détection des points clés des membres inférieurs humains; fusion de caractéristiques multi-résolutions; mécanisme d’attention; pré-étiquetage

阅读全文