فيما يتعلق بمشكلة صعوبة تحقيق تتبع عالي الدقة وسرعة الإطار للنماذج العميقة المعقدة في ظروف محدودة لموارد الحساب، يقدم هذا النص تعقيدًا مثيرًا للاهتمام يعتمد على التعقيد Transformer البصري المستنبط. يمكن لهذا المتعقب البصري أن يتغلب بفعالية على التحديات مثل حركة سريعة للهدف والضباب الحركي من خلال إدخال وحدة تصحيح الصورة الديناميكية التي تمزج بين الصورة المتطابقة الحالية والصورة المتوقعة القائمة على تدفق الضوء. من أجل تقليل تعقيد النموذج، اعتمد هذا النص استراتيجية تعلم تعقيد المعرفة لضغط النموذج، ودمج عدم التأكد المتغير مع الدالة الخسارة من خلال تعلم الأوزان المفقودة للخسارة للحصول على مختلف المهام الفرعية، مما يجنب بذل المتاعب والصعوبة في ضبط اليد. في الوقت نفسه، اعتمد هذا النص أيضًا استراتيجية التشويش العشوائي أثناء العملية التدريبية لتعزيز صلابة النموذج. قدم هذا النص اثنين من الإطارات المتباينة للتتبع: KTransT-T و KTransT، وأجرى تجربة مقارنة مع 12 خوارزمية على خمس مجموعات بيانات عامة. توضح نتائج التجربة أن خوارزمية KTransT-T تحسن بفعالية دقة التتبع ومعدل النجاح، بينما يحقق KTransT دقة تتبع مقارنة بالخوارزميات الرئيسية مع تحقيق تتبع في الوقت الحقيقي بسرعة تصل إلى 158 إطار في الثانية، مما يلبي احتياجات التتبع في الوقت الحقيقي.