Para abordar el problema de la escasez de datos anotados en tareas de segmentación de imágenes celulares y las limitaciones de los métodos tradicionales de aumento, este estudio propone primero un método de aumento de datos basado en un modelo de difusión para la generación conjunta de imágenes celulares y máscaras. Este método construye un marco de generación conjunta compuesto por una U-Net de predicción de ruido y un muestreador de ruido, apilando las imágenes celulares y las máscaras por canales para formar una imagen conjunta de cuatro canales, logrando la generación conjunta en una sola etapa de datos sintéticos de alta calidad y evitando errores introducidos por la generación en múltiples etapas. El modelo integra incrustaciones temporales y un mecanismo de atención múltiple de cabezas para mejorar la capacidad de modelar características estructurales celulares y la correspondencia con las máscaras, y utiliza una función de pérdida de error cuadrático medio junto con una programación de tasa de aprendizaje de recocido coseno para optimizar el entrenamiento. Los resultados experimentales exhaustivos en los conjuntos de datos de referencia CryoNuSeg e ISBI2012 muestran que el método propuesto mejora significativamente el rendimiento de los modelos de segmentación posteriores. Bajo la configuración de muestreo DPM++ 2M Karras, el IoU y Dice de CryoNuSeg alcanzan el 62.50% y 75.78% respectivamente, superando los métodos tradicionales de aumento como el volteo y la rotación. Los resultados verifican la superioridad del aumento por generación conjunta para ampliar la diversidad de datos y mejorar la precisión de la segmentación, proporcionando una solución eficiente y factible para la ampliación de datos en escenarios de escasez de anotaciones para la segmentación de imágenes celulares.
关键词
segmentación de imágenes celulares; modelo de difusión; aumento de datos; UNet; generación conjunta