Для решения проблемы ограниченной выразительной способности признаков и недостаточной устойчивости традиционных моделей сегментации при обработке сложных фонов или областей с мелкими дефектами зубчатых колес в статье предложена сеть сегментации на основе многоуровневого слияния признаков и блочного внимания, направленная на повышение способности представления визуальных признаков зубчатых колес и эффективности обнаружения мелких дефектов. Во-первых, модуль многомасштабного усиления признаков заменяет стандартный модуль понижающей дискретизации энкодера UNet, используя параллельную многоветвевую сверточную структуру для совместного извлечения многомасштабных и многоканальных признаков, что усиливает восприятие локальных деталей и глобального контекста; во-вторых, после понижающей дискретизации введен блочный модуль фокусировки признаков с использованием механизма многоголового внимания по блокам для независимого анализа локальных областей, что значительно повышает чувствительность модели к микроскопическим дефектам и локальным текстурным различиям; наконец, разработана взвешенная совместная функция потерь, объединяющая Dice loss, BCE loss и градиентные ограничения для уменьшения проблемы несбалансированности классов и оптимизации качества границ сегментации. Экспериментальные результаты на созданных и общедоступных наборах данных дефектов зубчатых колес показали, что предложенная модель превосходит UNet и другие современные модели в задачах сегментации различных типов дефектов зубчатых колес, достигая точности 91,27% и 85,88% соответственно. Метод эффективен и обеспечивает своевременное детектирование точного сегментирования дефектов поверхности зубчатых колес.