[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Une méthode de segmentation des tumeurs cérébrales basée sur CLIP et 3D U-Net avec guidage sémantique intermodal et fusion de caractéristiques multi-niveaux

Created by
  • Haebom

Auteur

Mingda Zhang

Contour

Dans cet article, nous proposons une architecture de fusion multi-niveaux basée sur l'apprentissage profond pour la segmentation précise des tumeurs cérébrales par imagerie par résonance magnétique (IRM). Contrairement aux méthodes existantes, telles que 3D U-Net, qui s'appuient uniquement sur les caractéristiques visuelles extraites des séquences IRM, cette étude exploite les connaissances sémantiques contenues dans les rapports médicaux. Le modèle CLIP (Contrastive Language-Image Pre-training) est utilisé pour intégrer les informations au niveau des pixels, des caractéristiques et de la sémantique afin de permettre un traitement complet des données de bas niveau vers des concepts de haut niveau grâce à la fusion multi-niveaux. Le modèle proposé combine la capacité de compréhension sémantique du modèle CLIP avec la capacité d'extraction de caractéristiques spatiales de 3D U-Net grâce à trois mécanismes : la liaison sémantique 3D-2D, le guidage sémantique intermodal et le mécanisme d'attention sémantique. Les résultats expérimentaux sur l'ensemble de données BraTS 2020 montrent que le modèle proposé atteint 0,8567, ce qui représente une amélioration de 4,8 % du coefficient Dice global par rapport au U-Net 3D existant, et le coefficient Dice augmente de 7,3 % dans la région tumorale d'amélioration cliniquement importante (ET).

Takeaways, Limitations

Takeaways:
Nous démontrons que l’exploitation des informations sémantiques issues des rapports médicaux peut améliorer les performances de segmentation des tumeurs cérébrales.
Nous proposons une architecture de fusion multi-niveaux capable de traiter efficacement des données de bas niveau vers des concepts de haut niveau.
En combinant les atouts du modèle CLIP et du 3D U-Net, nous avons considérablement amélioré la précision de la segmentation des tumeurs cérébrales, en particulier dans la région ET cliniquement importante.
Limitations:
Des recherches supplémentaires sont nécessaires sur les performances de généralisation du modèle proposé. Une évaluation des performances sur des ensembles de données autres que celui de BraTS 2020 est également nécessaire.
Les performances des modèles peuvent être affectées par la qualité et la cohérence des rapports médicaux. Une évaluation de la robustesse des différents types de rapports médicaux est nécessaire.
Le modèle CLIP peut être coûteux en calcul et ne pas convenir aux applications temps réel. Des recherches sont nécessaires pour améliorer l'efficacité des calculs.
👍