Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

DMS-Net: Red siamesa multiescala de doble modo para la clasificación de imágenes del fondo de ojo binocular

Created by
  • Haebom

Autor

Guohao Huo, Zibo Lin, Zitong Wang, Ruiting Dai, Hao Tang

Describir

En este artículo, proponemos una red siamesa multiescala y bimodal, DMS-Net, para la clasificación de imágenes binoculares de fondo de ojo. DMS-Net extrae características semánticas profundas de imágenes pareadas de fondo de ojo mediante una estructura principal Siamese ResNet-152 con reparto de pesos. Para abordar problemas como la ambigüedad de los límites de las lesiones y la distribución patológica dispersa, introducimos un módulo multiescala sensible al contexto (MSCAM) que integra mecanismos de agrupación adaptativa y atención. Además, combinamos eficazmente el contexto global y las características locales de los bordes mejorando las interacciones intermodales mediante la recalibración espacio-semántica y la atención bidireccional a través del módulo de fusión de características bimodal (DMFF). Al evaluarse en el conjunto de datos ODIR-5K, DMS-Net alcanza un rendimiento de vanguardia con una precisión del 82,9 %, una recuperación del 84,5 % y un índice kappa de Cohen del 83,2 %, lo que demuestra una capacidad superior para detectar patologías simétricas y optimizar la toma de decisiones clínicas en enfermedades oftálmicas.

Takeaways, Limitations

Takeaways:
Mejorar la precisión del diagnóstico de enfermedades oftálmicas considerando la correlación entre las imágenes del fondo binocular.
Solución de problemas de ambigüedad en los límites de las lesiones y de distribución patológica dispersa con los módulos MSCAM y DMFF.
Logra un rendimiento de última generación en el conjunto de datos ODIR-5K (82,9 % de precisión, 84,5 % de recuperación, 83,2 % de kappa de Cohen).
Contribuir al diagnóstico de enfermedades oftálmicas y apoyar la toma de decisiones clínicas.
Limitations:
Solo se presenta la validación del rendimiento en el conjunto de datos ODIR-5K, por lo que el rendimiento de generalización en otros conjuntos de datos es incierto.
Coste computacional y consumo potencial de recursos debido a la complejidad del modelo.
Se necesitan más estudios para generalizar el rendimiento en una variedad de condiciones oftálmicas.
👍