تعاني نماذج اكتشاف نقاط المفتاح البشرية الحالية من نقص في التركيز على الميزات عالية الدقة، حيث يستخدم حجم بيانات منخفض الدقة مع أخطاء ترميزية كبيرة أثناء التدريب، مما يؤدي إلى نتائج غير مستقرة في مهام تحليل المشي ودقة تحديد ضعيفة. لمعالجة هذه المشكلة، نقترح نموذجًا لاكتشاف نقاط مفتاح الأطراف السفلية البشرية يعتمد على دمج ميزات متعددة الدقة، حيث يتم استخدام صورة عالية الدقة كمدخلات للشبكة، ويتم استخراج الميزات منخفضة الدقة العالمية باستخدام شبكة MobileNet v1 المعدلة مع آلية الانتباه، مع التنبؤ الأولي بمواقع نقاط المفتاح، بجانب شبكة ضحلة متوازية لاستخراج ميزات موضعية عالية الدقة، ثم يتم دمج الميزات متعددة الدقة باستخدام هيكل متسلسل للبواقي وآلية الانتباه لتحسين دقة التنبؤ بالنقاط وتخفيف المشكلة الحسابية المرتبطة بالصور عالية الدقة. تم إنشاء مجموعة بيانات لنقاط المفتاح للأطراف السفلية عالية الدقة والدقة باستخدام طريقة التعليم المسبق لضمان دقة تدريب النموذج. تم تقييم النموذج بدلالة تعقيد النموذج، سرعة الكشف، دقة الكشف، وخطأ الكشف، مع مقارنة تجريبية مع طرق كلاسيكية ومتقدمة. أظهرت النتائج أن نموذجنا وصل إلى معدل كشف اختبار بنسبة 95.2٪، متفوقًا على Lightweight-OpenPose، HRNet-W32، HRNet-W48، YOLO-Pose، RTMPose وSimCC، حيث تحسنت دقة الكشف من 4.1٪ إلى 83.6٪، وزادت إطارات الأداء في الثانية (FPS) من 7.6 إلى 13.9. يثبت ذلك فعالية النموذج المقترح في اكتشاف نقاط المفتاح عالية الدقة للأطراف السفلية البشرية.
关键词
اكتشاف نقاط المفاتيح للأطراف السفلية البشرية; دمج ميزات متعددة الدقة; آلية الانتباه; التعليم المسبق