Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

EVM-Fusion: Una visión explicable de la arquitectura Mamba con fusión algorítmica neuronal

Created by
  • Haebom

Autor

Zichuan Yang, Yongzhi Wang

Describir

Este artículo presenta la arquitectura Explainable Vision Mamba (EVM-Fusion) para mejorar la precisión, la interpretabilidad y la generalización de la clasificación de imágenes médicas. EVM-Fusion emplea un diseño multipaso que utiliza rutas basadas en DenseNet y U-Net, cada una optimizada por un módulo Vision Mamba (Vim). Diversas características se integran dinámicamente mediante un proceso de fusión de dos pasos que involucra atención intermodal y un bloque iterativo de Fusión de Algoritmos Neurales (NAF). La explicabilidad intrínseca se internaliza mediante atención espacial específica de la ruta, mapas de valores Δ de Vim, atención SE de la característica original y ponderaciones de atención intermodal. Los resultados experimentales en un conjunto diverso de datos de imágenes médicas multiinstitucionales de nueve clases demuestran un rendimiento de clasificación robusto, alcanzando una precisión de prueba del 99,75 %, lo que resalta el potencial de la IA confiable en el diagnóstico médico.

Takeaways, Limitations

Takeaways:
La precisión de la clasificación de imágenes médicas se mejoró significativamente mediante un diseño de trayectos múltiples y un mecanismo de fusión basado en NAF (se logró una precisión de prueba del 99,75%).
Proporcionamos información multifacética sobre el proceso de toma de decisiones a través de mecanismos de atención específicos de cada ruta y mapas de valores Δ, mejorando así la interpretabilidad.
Ha demostrado potencial para contribuir al desarrollo de sistemas de diagnóstico médico confiables basados ​​en IA.
Limitations:
El conjunto de datos de imágenes médicas multiinstitucionales de nueve clases propuesto podría no reflejar plenamente la diversidad de los entornos clínicos del mundo real. Se requiere mayor validación de su generalización.
La complejidad del bloque NAF puede aumentar los costos computacionales, lo que puede limitar su aplicación en sistemas de diagnóstico médico en tiempo real.
Se carece de un análisis comparativo con otros modelos de clasificación de imágenes médicas. Se requiere una validación más exhaustiva de su rendimiento.
👍