Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Un modèle hybride de transformateur CNN entièrement convolutif pour la détection de maladies intrinsèquement interprétables à partir d'images du fond d'œil de la rétine

Created by
  • Haebom

Auteur

Kerol Djoumessi, Samuel Ofosu Mensah, Philipp Berens

Contour

Cet article propose un modèle hybride interprétable pour l'analyse d'images médicales, combinant les capacités d'extraction de caractéristiques locales des CNN avec les capacités de capture de dépendances globales de ViT. Pour relever les défis d'interprétabilité des modèles hybrides existants, nous avons développé une architecture CNN-Transformer entièrement convolutive prenant en compte l'interprétabilité dès la conception. Ce modèle a été appliqué à deux tâches d'analyse d'images médicales pour la détection de maladies rétiniennes, obtenant des performances prédictives supérieures à celles des modèles boîte noire et interprétables existants. Il génère également des cartes de preuves éparses spécifiques à chaque classe en un seul passage. Le code est disponible sur GitHub.

Takeaways, Limitations_

Takeaways:
Un modèle hybride CNN-ViT est présenté qui prend en compte l’interprétabilité dès la phase de conception.
Obtenez des performances prédictives supérieures par rapport aux modèles de boîte noire et aux modèles interprétables existants.
Générez des cartes de preuves éparses spécifiques à la classe via un seul passage vers l'avant pour comprendre intuitivement le processus de prise de décision du modèle.
Contribuer à l'amélioration de l'interprétabilité des modèles dans le domaine de l'analyse d'images médicales.
Limitations:
Les performances du modèle proposé sont limitées à une tâche spécifique de détection de maladies rétiniennes. Des recherches supplémentaires sont nécessaires pour déterminer sa généralisabilité à d'autres tâches d'analyse d'images médicales.
L’interprétabilité du modèle repose sur la carte des preuves présentée et manque d’analyse comparative avec d’autres méthodes d’interprétation.
D’autres expériences et comparaisons de performances sur différents ensembles de données sont nécessaires.
👍