Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Un modèle hybride de transformateur CNN entièrement convolutif pour la détection de maladies intrinsèquement interprétables à partir d'images du fond d'œil de la rétine

Created by
  • Haebom

Auteur

Kerol Djoumessi, Samuel Ofosu Mensah, Philipp Berens

Contour

Cet article propose un modèle hybride combinant un réseau neuronal convolutif (CNN) et un transformateur de vision (ViT) pour l'interprétabilité en analyse d'images médicales. Pour relever les défis d'interprétabilité des modèles hybrides existants, nous avons développé une architecture de transformateur CNN entièrement convolutif prenant en compte l'interprétabilité dès la conception. Ce modèle a été appliqué à la détection des maladies rétiniennes, obtenant des performances prédictives supérieures à celles des modèles boîte noire et interprétables existants. Il génère également des cartes de preuves éparses spécifiques à chaque classe en un seul passage. La reproductibilité a été assurée par un code source ouvert.

Takeaways, Limitations_

Takeaways:
Nous présentons un modèle hybride CNN-ViT interprétable dans l'analyse d'images médicales, contribuant à la compréhension du processus décisionnel du modèle.
Améliore la fiabilité du diagnostic en fournissant des cartes de preuves locales spécifiques à la classe ainsi que des performances prédictives supérieures par rapport aux modèles existants.
Générer des cartes de preuves efficaces grâce à un seul passage vers l'avant.
Assurer la reproductibilité de la recherche grâce au code ouvert.
Limitations:
L'évaluation des performances du modèle proposé est limitée à un ensemble spécifique de données d'images médicales (maladies rétiniennes). Il est nécessaire de vérifier les performances de généralisation sur d'autres types de données d'images médicales.
L’interprétabilité du modèle dépend de la méthode présentée et nécessite une analyse comparative avec d’autres méthodologies d’interprétation.
ÉTant donné qu'il est actuellement spécialisé dans la détection des maladies rétiniennes, des recherches supplémentaires sont nécessaires sur son applicabilité et ses performances de généralisation à d'autres problèmes d'analyse d'images médicales.
👍