多解像度特徴融合に基づく人体下肢キーポイント検出

XIA Xiaohua ,  

XIANG Haoming ,  

CHEN Jian ,  

FENG Xinmiao ,  

QIU Fabo ,  

WANG Yaoyao ,  

摘要

従来の人体キーポイント検出モデルは高解像度特徴への注目が不足しており、学習に使用されるデータセットの解像度が低く、アノテーション誤差が大きいため、歩行解析などのタスクにおいて検出結果が不安定で位置精度が低い。これらの問題に対処するために、高解像度画像をネットワークの入力とし、微調整したMobileNet v1ネットワークと注意機構を用いてグローバルな低解像度特徴を抽出し、キーポイントの初期位置を予測し、並列の浅層ネットワークで局所的な高解像度特徴を抽出する多解像度特徴融合に基づく人体下肢キーポイント検出モデルを提案する。さらに、連続的な残差構造と注意機構を用いて異なる解像度の特徴を融合し、キーポイントの予測精度を向上させ、高解像度画像による高い計算負荷の問題を効果的に緩和する。モデル学習の精度を確保するために、事前ラベリング方式で高解像度かつ高精度な人体下肢キーポイントデータセットを作成した。モデルの複雑度、検出速度、検出精度、検出誤差を評価指標とし、他の従来の手法および先進的手法と実験的に比較した。結果は、提案モデルがテスト検出率95.2%を達成し、Lightweight-OpenPose、HRNet-W32、HRNet-W48、YOLO-Pose、RTMPose、SimCCモデルを上回り、検出精度が4.1%~83.6%向上し、FPSが7.6~13.9向上したことを示した。これは、高精度な人体下肢キーポイント検出における提案モデルの有効性を証明している。

关键词

人体下肢キーポイント検出; 多解像度特徴融合; 注意機構; 事前ラベリング

阅读全文