Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Insesgo de clase para la generalización en el diagnóstico médico

Created by
  • Haebom

Autor

Lishi Zuo, Man-Wai Mak, Lu Yi, Youzhi Tu

Describir

Este artículo se centra en el problema del sesgo en los modelos de diagnóstico médico, específicamente el sesgo de clase-característica causado por la dependencia de características fuertemente correlacionadas con un subconjunto de clases específicas. Este sesgo conduce a un bajo rendimiento del modelo y capacidad de generalización. Presentamos un método para entrenar un modelo sin sesgo de clase (Cls-unbias) que mitiga simultáneamente tanto el desequilibrio de clase como el sesgo de clase-característica. Específicamente, proponemos una pérdida de desigualdad clase por clase, que asegura que las muestras de clase positivas y negativas contribuyan por igual a la pérdida de clasificación, y un objetivo de optimización distribucionalmente robusto de grupo clase por clase, que es un objetivo de entrenamiento ponderado por clase que aumenta los pesos de las clases de bajo rendimiento. Demostramos experimentalmente el impacto negativo del sesgo de clase-característica en el rendimiento del modelo utilizando conjuntos de datos sintéticos y del mundo real, y demostramos que el método propuesto mitiga eficazmente tanto el sesgo de clase-característica como el desequilibrio de clase, mejorando así la capacidad de generalización del modelo.

Takeaways, Limitations

Takeaways:
Revelamos que el sesgo de características de clase es la principal causa del bajo rendimiento en los modelos de diagnóstico médico.
Se presenta una nueva metodología para abordar simultáneamente el desequilibrio de clases y el sesgo en las características de clase.
La metodología propuesta demuestra un rendimiento mejorado en conjuntos de datos médicos del mundo real.
Limitations:
Es necesaria una mayor validación de la generalización de la metodología propuesta.
Se requiere la evaluación de la aplicación y el desempeño en varios conjuntos de datos médicos.
Se necesita más investigación en profundidad sobre la definición y medición del sesgo de características de clase.
👍