Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Un modelo híbrido de CNN-Transformador totalmente convolucional para la detección de enfermedades inherentemente interpretable a partir de imágenes del fondo de ojo de la retina

Created by
  • Haebom

Autor

Kerol Djoumessi, Samuel Ofosu Mensah, Philipp Berens

Describir

Este artículo propone un modelo híbrido que combina una red neuronal convolucional (CNN) y un transformador de visión (ViT) para la interpretabilidad en el análisis de imágenes médicas. Para abordar los desafíos de interpretabilidad de los modelos híbridos existentes, desarrollamos una arquitectura de CNN-transformador completamente convolucional que consideró la interpretabilidad desde la etapa de diseño. Este modelo se aplicó a la detección de enfermedades de la retina, logrando un rendimiento predictivo superior al de los modelos de caja negra e interpretables existentes. Además, genera mapas de evidencia dispersa específicos de cada clase mediante una sola pasada hacia adelante. La reproducibilidad se garantizó mediante código fuente abierto.

Takeaways, Limitations

Takeaways:
Presentamos un modelo híbrido CNN-ViT interpretable en el análisis de imágenes médicas, contribuyendo a la comprensión del proceso de toma de decisiones del modelo.
Mejora la confiabilidad del diagnóstico al proporcionar mapas de evidencia local específicos de cada clase junto con un desempeño predictivo superior en comparación con los modelos existentes.
Generación de mapas de evidencia eficientes a través de una única pasada hacia adelante.
Garantizar la reproducibilidad de la investigación mediante código abierto.
Limitations:
La evaluación del rendimiento del modelo propuesto se limita a un conjunto específico de datos de imágenes médicas (enfermedades de la retina). Es necesario verificar su generalización en otros tipos de datos de imágenes médicas.
La interpretabilidad del modelo depende del método presentado y requiere un análisis comparativo con otras metodologías de interpretación.
Dado que actualmente está especializado en la detección de enfermedades de la retina, se necesita más investigación sobre su aplicabilidad y rendimiento de generalización a otros problemas de análisis de imágenes médicas.
👍