Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
Libérer les modèles de diffusion et d'espace d'état pour la segmentation des images médicales
Created by
Haebom
Auteur
Rong Wu, Ziqi Chen, Liming Zhong, Heng Li, Hai Shu
Contour
Les modèles de segmentation d'images médicales existants sont entraînés sur un seul jeu de données et manquent de robustesse face à la détection d'organes ou de tumeurs invisibles. Dans cet article, nous soutenons que le développement d'un modèle robuste capable d'identifier des catégories de tumeurs rares ou nouvelles, absentes lors de l'entraînement, est crucial pour le développement des applications d'imagerie médicale. Nous proposons DSM, un nouveau framework exploitant les modèles de diffusion et d'espace d'état pour segmenter les catégories de tumeurs invisibles au-delà des données d'entraînement. DSM améliore la précision de la classification grâce à deux ensembles de requêtes d'objets entraînées dans un décodeur d'attention modifié. Nous apprenons d'abord la requête d'organe qui capture les caractéristiques visuelles au niveau de l'organe grâce à une stratégie de regroupement de caractéristiques sensible aux objets, puis nous améliorons la requête de tumeur qui permet une segmentation précise des tumeurs invisibles en nous concentrant sur les invites visuelles basées sur la diffusion. Nous intégrons également la fusion de caractéristiques guidée par la diffusion pour améliorer les performances de la segmentation sémantique. En intégrant les intégrations de texte CLIP, DSM renforce la robustesse du modèle dans divers scénarios et tâches multi-étiquettes en capturant les classes sensibles aux catégories et en améliorant les connaissances en matière de transfert de langage. Des expériences approfondies démontrent la performance supérieure du DSM dans diverses tâches de segmentation tumorale. Le code est disponible à l'adresse https://github.com/Rows21/k-Means_Mask_Mamba에서 .
Takeaways, Limitations
•
Takeaways:
◦
Nous présentons une nouvelle approche du problème de la segmentation d’images médicales incluant des tumeurs non présentes dans les données de formation.
◦
Améliorer la précision et la robustesse de la segmentation tumorale en combinant des modèles de diffusion et des modèles d'espace d'état.
◦
Adaptabilité accrue à divers types de tumeurs et tâches multi-étiquettes en exploitant les requêtes d'objets et les intégrations de texte CLIP.
◦
Validation de l'efficacité du DSM grâce à d'excellents résultats expérimentaux.
•
Limitations:
◦
Manque de description détaillée du contenu spécifique du code présenté et des mesures d'évaluation des performances.
◦
Une validation supplémentaire des performances de généralisation dans divers ensembles de données d’images médicales et environnements cliniques est nécessaire.
◦
Il peut y avoir un biais en faveur de certains types de tumeurs ou d’organes.
◦
Des recherches et des validations supplémentaires sont nécessaires pour des applications cliniques pratiques.