В плотных сценных условиях точность детектора снижается из-за частичного перекрытия тела пешеходов и разного масштаба пешеходов. Однако степень перекрытия головы пешехода обычно меньше, поэтому ее можно использовать для помощи в обнаружении. В связи с этим предложен алгоритм обнаружения пешеходов, основанный на объединении информации головы и всей фигуры. Во-первых, разработана сеть извлечения признаков с использованием плотных соединений и улучшенного слияния для усиления извлечения многоуровневых признаков и повышения чувствительности сети к пешеходам разного масштаба. Во-вторых, оптимизирован механизм выборки в модуле региональных предложений, предложена стратегия добычи неоднородных сложных образцов на основе оценки степени перекрытия, с особым вниманием к сильно перекрывающимся сложным образцам, чтобы повысить адаптивность сети к перекрыванию. Затем построена стратегия совместного обнаружения головы и всей фигуры, а также оптимизирован этап постобработки, используя результаты обнаружения головы для восстановления ошибочно подавленных из-за перекрытия рамок обнаружения, что снижает процент пропусков. Также с учетом особенностей совместной структуры детекции оптимизирована функция потерь, что дополнительно снижает ложные срабатывания и пропуски из-за перекрытий. Наконец, эффективность предложенного алгоритма подтверждена экспериментально. Результаты показывают, что алгоритм снижает логарифмический средний процент пропусков на 5,7% и повышает среднюю точность на 4% на наборе данных CrowdHuman с высокой степенью перекрытия, а на двух подмножествах с небольшим масштабом из набора TJU-DHD-pedestrian снижает логарифмический средний процент пропусков на 2,4% и 2,1% соответственно, эффективно повышая способность обнаружения перекрывающихся и многоуровневых пешеходов.