Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Un modelo híbrido de CNN-Transformador totalmente convolucional para la detección de enfermedades inherentemente interpretable a partir de imágenes del fondo de ojo de la retina

Created by
  • Haebom

Autor

Kerol Djoumessi, Samuel Ofosu Mensah, Philipp Berens

Describir

Este artículo propone un modelo híbrido interpretable para el análisis de imágenes médicas que combina las capacidades de extracción de características locales de las CNN con las capacidades de captura de dependencias globales de ViT. Para superar los desafíos de interpretabilidad de los modelos híbridos existentes, desarrollamos una arquitectura CNN-Transformador totalmente convolucional que consideró la interpretabilidad desde la etapa de diseño y la aplicó a la detección de enfermedades de la retina. El modelo propuesto supera a los modelos de caja negra e interpretables existentes en rendimiento predictivo y genera mapas de evidencia dispersa específicos de cada clase en una sola pasada. El código está disponible en GitHub.

Takeaways, Limitations

Takeaways:
Presentamos una implementación efectiva de un modelo híbrido CNN-Transformer interpretable para el análisis de imágenes médicas.
Lograr un rendimiento predictivo y una interpretabilidad superiores en comparación con los modelos de caja negra existentes.
Expone de forma transparente el proceso de toma de decisiones del modelo al generar mapas de evidencia dispersa específicos de cada clase en una sola pasada.
Garantizar la reproducibilidad y extensibilidad mediante código abierto.
Limitations:
El rendimiento del modelo propuesto está limitado a una tarea específica de análisis de imágenes médicas (detección de enfermedades de la retina).
El rendimiento de generalización a otros tipos de imágenes médicas o enfermedades requiere más estudios.
Es posible que falte una evaluación cuantitativa de la precisión de la interpretación del mapa de evidencia.
👍