Для решения проблемы нехватки разметочных данных в задачах сегментации клеточных изображений и ограничений традиционных методов аугментации, в данном исследовании впервые предложен метод расширения данных на основе диффузионной модели, совместно генерирующий клеточные изображения и маски. Метод строит объединённую генеративную схему, состоящую из U-Net для предсказания шума и сэмплера шума, объединяя клеточные изображения и маски по каналам в четырёхканальное совместное изображение, что обеспечивает одностадийную генерацию высококачественных синтетических данных и избегает ошибок, возникающих при многоступенчатой генерации. Модель интегрирует временную эмбединговую информацию и механизм многоголового самовнимания для улучшения моделирования структурных характеристик клеток и соответствия масок, используясь функцию потерь среднеквадратичной ошибки и косинусный аннуляционный план обучения для оптимизации. Всеобъемлющие эксперименты на эталонных наборах CryoNuSeg и ISBI2012 показали значительное улучшение производительности последующих моделей сегментации. При настройках сэмплинга DPM++ 2M Karras значения IoU и Dice для CryoNuSeg достигли 62,50% и 75,78% соответственно, превосходя традиционные методы аугментации, такие как отражение и поворот. Результаты подтверждают превосходство совместной генеративной аугментации в расширении разнообразия данных и повышении точности сегментации, обеспечивая эффективное решение для расширения данных при дефиците разметки в сегментации клеточных изображений.
关键词
сегментация клеточных изображений; диффузионная модель; расширение данных; UNet; совместная генерация