Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

EVM-Fusion : une architecture Mamba explicable avec fusion algorithmique neuronale

Created by
  • Haebom

Auteur

Zichuan Yang, Yongzhi Wang

Contour

Cet article présente l'architecture Explainable Vision Mamba (EVM-Fusion) visant à améliorer la précision, l'interprétabilité et la généralisabilité de la classification des images médicales. EVM-Fusion utilise une conception multipasse utilisant des chemins basés sur DenseNet et U-Net, chacun amélioré par un module Vision Mamba (Vim). Diverses fonctionnalités sont intégrées dynamiquement via un processus de fusion en deux étapes impliquant l'attention intermodale et un bloc itératif de fusion d'algorithmes neuronaux (NAF). L'explicabilité intrinsèque est internalisée par l'attention spatiale spécifique au chemin, les cartes de valeurs Δ Vim, l'attention SE des fonctionnalités originales et les pondérations d'attention intermodale. Les résultats expérimentaux sur un ensemble de données d'images médicales multi-institutionnelles de neuf classes démontrent des performances de classification robustes, atteignant une précision de test de 99,75 %, soulignant le potentiel d'une IA fiable dans le diagnostic médical.

Takeaways, Limitations

Takeaways:
La précision de la classification des images médicales a été considérablement améliorée grâce à une conception multi-chemins et à un mécanisme de fusion basé sur NAF (précision de test de 99,75 % atteinte).
Nous fournissons des informations multiformes sur le processus de prise de décision grâce à des mécanismes d'attention spécifiques au chemin et à des cartes de valeurs Δ, améliorant ainsi l'interprétabilité.
Il a démontré son potentiel pour contribuer au développement de systèmes de diagnostic médical fiables basés sur l’IA.
Limitations:
L'ensemble de données d'images médicales multi-institutionnelles à neuf classes proposé pourrait ne pas refléter pleinement la diversité des contextes cliniques réels. Une validation plus approfondie de sa généralisabilité est nécessaire.
La complexité du bloc NAF peut augmenter les coûts de calcul, ce qui peut limiter son application dans les systèmes de diagnostic médical en temps réel.
L'analyse comparative avec d'autres modèles de classification d'images médicales fait défaut. Une validation plus approfondie de ses performances est nécessaire.
👍