Algoritmo de detección de peatones basado en la combinación de información de cabeza y cuerpo completo

MA Ximing ,  

LI Ning ,  

WU Di ,  

LIU Yidou ,  

YU Xiangyue ,  

LI Zheng ,  

摘要

En escenas densas, la precisión del detector disminuye debido a que el cuerpo de los peatones está bloqueado y a la variación en sus escalas. Sin embargo, la cabeza de los peatones suele estar menos bloqueada, por lo que puede utilizarse para ayudar en la detección. En este sentido, se propone un algoritmo de detección de peatones basado en la combinación de la información de la cabeza y del cuerpo completo. En primer lugar, se diseñó una red de extracción de características basada en conexiones densas y una fusión reforzada para fortalecer la extracción de características multiescala y mejorar la sensibilidad de la red para detectar peatones de diferentes escalas. En segundo lugar, se optimizó el mecanismo de muestreo del módulo de propuesta de regiones y se propuso una estrategia de minería de muestras difíciles no uniforme basada en la tasa de solapamiento de oclusión, prestando especial atención a las muestras difíciles con oclusión severa para mejorar la adaptabilidad de la red a las oclusiones. Luego, se construyó una estrategia de detección conjunta de cabeza y cuerpo completo, y se optimizó la etapa de postprocesamiento, utilizando los resultados de detección de la cabeza para recuperar las cajas de detección completas que fueron erróneamente suprimidas debido a la oclusión, reduciendo así la tasa de omisión. Al mismo tiempo, se optimizó la función de pérdida en función de las características del marco de detección conjunta, aliviando aún más los errores y omisiones causados por la oclusión. Finalmente, se verificó la efectividad del algoritmo propuesto mediante experimentos. Los resultados muestran que el algoritmo reduce la tasa media logarítmica de omisión en un 5,7% y mejora la precisión media en un 4% en el conjunto de datos CrowdHuman con alto grado de oclusión, y reduce la tasa media logarítmica de omisión en un 2,4% y 2,1% respectivamente en dos subconjuntos de pequeña escala del conjunto de datos TJU-DHD-pedestrian, mejorando efectivamente la capacidad de detección de peatones ocluidos y multiescala.

关键词

Detección de peatones; detección conjunta; fusión de características multiescala; minería de casos difíciles; optimización de postprocesamiento

阅读全文