Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

ÉTude systématique des modèles d'apprentissage profond et des méthodes xAI pour la détection des régions d'intérêt dans les examens IRM

Created by
  • Haebom

Auteur

Justin Yiu, Kushank Arora, Daniel Steinberg, Rohit Ghiya

Contour

Cette étude présente un système de détection automatique de région d'intérêt (ROI) utilisant des techniques d'apprentissage profond et d'IA explicable (xAI) pour améliorer l'efficacité et l'objectivité de l'interprétation de l'IRM, essentielle à l'évaluation des lésions du genou. Différentes architectures d'apprentissage profond, dont ResNet50, InceptionV3, Vision Transformers (ViT) et diverses variantes d'U-Net, ont été évaluées à l'aide de méthodes d'apprentissage supervisé et auto-supervisé. Des techniques xAI, telles que Grad-CAM et Saliency Maps, ont été intégrées pour améliorer l'interprétabilité. Les performances ont été évaluées à l'aide de l'aire sous la courbe (AUC) (classification), du PSNR/SSIM (qualité de reconstruction) et de la visualisation qualitative des ROI. ResNet50 a démontré des performances supérieures en matière de classification et d'identification des ROI par rapport aux modèles basés sur Transformer sur l'ensemble de données MRNet. Un modèle combiné U-Net + MLP a montré un potentiel d'amélioration de la reconstruction et de l'interprétabilité, mais des performances de classification inférieures, tandis que Grad-CAM a fourni les explications les plus significatives cliniquement parmi toutes les architectures. En conclusion, l’apprentissage par transfert basé sur CNN s’est avéré le plus efficace sur cet ensemble de données, et des améliorations futures des performances des modèles Transformer grâce à une préformation à grande échelle sont attendues.

Takeaways, Limitations

Takeaways:
Nous démontrons que l’apprentissage par transfert CNN basé sur ResNet50 est efficace pour la détection des ROI de l’IRM du genou.
Visualisez le processus de prise de décision du modèle et améliorez l'interprétabilité clinique en utilisant les techniques xAI (Grad-CAM).
Présentation du potentiel de développement futur de la structure U-Net + MLP (amélioration de l'utilisation et de l'interprétabilité des caractéristiques spatiales).
Limitations:
La taille relativement petite de l’ensemble de données MRNet limite l’évaluation du potentiel des modèles Transformer.
Des recherches supplémentaires utilisant des ensembles de données de pré-formation à grande échelle sont nécessaires.
Nécessité d'améliorer les performances de classification de la structure U-Net + MLP.
👍