Mehrgranulare Segmentierung von Mebom-Drüsen-Bildern basierend auf CNN und Transformer

YANG Song ,  

XIA Zhenping ,  

LI Li ,  

WU Yanshu ,  

摘要

Um die Probleme der mehrstufigen Verarbeitung und unscharfen Kanten bei der Segmentierung von Mebom-Drüsen-Bildern zu lösen, wurde in dieser Arbeit ein End-to-End-Mehrgranularitäts-Segmentierungsalgorithmus entwickelt. In der Kodierungsphase wird die TransUNet-Encoder-Architektur verwendet, die effizient gemeinsame Merkmale der Lid- und Drüsenregion extrahieren kann; in der Dekodierungsphase werden zwei Dekodierungspfade mit unterschiedlichen Dekodierzweigen für die verschiedenen Merkmale der Lid- und Drüsenregionen eingesetzt. Gleichzeitig wurde für die Drüsenregion ein Multiskalen-Merkmalsfusionsmodul entworfen und ein Kanalaufmerksamkeitsmechanismus in die Sprungverbindungen eingefügt. Diese Optimierungen verbessern die Kantengenauigkeit, die Texturklarheit und die Formkontur, wodurch effektiv Probleme mit unscharfen Rändern und Drüsenverklebungen gelöst werden. Für die Lidregion wird eine Standard-Dekodierungsstruktur zur Segmentierungsvorhersage verwendet. Im Vergleich zu bestehenden fortschrittlichen Segmentierungsmethoden zeigt der vorgeschlagene Algorithmus überlegene Leistungen im mittleren Genauigkeitswert der oberen und unteren Mebom-Drüsen, insbesondere bei den Schlüsselindikatoren mittleres Intersection over Union und Dice-Ähnlichkeitskoeffizient, die 79,9 % bzw. 76,5 % erreichen und somit TransUNet um 3,2 % bzw. 5,3 % übertreffen. Der Algorithmus dieser Arbeit kann die Zielregionen von Mebom-Drüsen-Bildern präzise segmentieren und bietet eine Grundlage für die unterstützende Diagnose von Funktionsstörungen der Mebom-Drüsen.

关键词

Segmentierung von Mebom-Drüsen-Bildern;Mehrgranulare Segmentierung;CNN;Transformer;Medizinische Bildverarbeitung

阅读全文