Os modelos existentes de detecção de pontos-chave do corpo humano carecem de atenção às características de alta resolução. Os conjuntos de dados usados durante o treinamento têm baixa resolução e erros significativos de anotação, resultando em resultados instáveis e baixa precisão de localização em tarefas como análise da marcha. Para resolver esses problemas, propõe-se um modelo de detecção de pontos-chave dos membros inferiores baseado na fusão de características de múltiplas resoluções, utilizando imagens de alta resolução como entrada da rede. A rede MobileNet v1 ajustada, combinada com um mecanismo de atenção, extrai características globais de baixa resolução e prevê inicialmente a posição dos pontos-chave. Paralelamente, uma rede superficial extrai características locais de alta resolução. Em seguida, uma estrutura residual contínua e um mecanismo de atenção são utilizados para fundir características de diferentes resoluções, melhorando a precisão da predição dos pontos-chave e mitigando o alto custo computacional associado a imagens de alta resolução. Um conjunto de dados de pontos-chave dos membros inferiores com alta resolução e alta precisão foi criado usando um método de pré-rotulagem para garantir a precisão do treinamento do modelo. O modelo foi avaliado com base na complexidade, velocidade de detecção, precisão e erro de detecção, comparado experimentalmente com métodos clássicos e avançados. Os resultados mostraram que o modelo proposto atingiu uma taxa de detecção de 95,2%, superando Lightweight-OpenPose, HRNet-W32, HRNet-W48, YOLO-Pose, RTMPose e SimCC, com aumento da precisão de 4,1% a 83,6% e incremento do FPS de 7,6 a 13,9. Isso comprova a eficácia do modelo proposto na detecção precisa de pontos-chave dos membros inferiores humanos.
关键词
detecção de pontos-chave dos membros inferiores; fusão de características de múltiplas resoluções; mecanismo de atenção; pré-rotulagem