Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Aprendizaje de refuerzo adaptativo, justo y fuera de línea, guiado por la viabilidad para la gestión de la atención de Medicaid

Created by
  • Haebom

Autor

Sanjay Basu, Sadiq Y. Patel, Parth Sheth, Bhairavi Muralidharan, Namrata Elamaran, Aakriti Kinra, Rajaie Batniji

Describir

Este artículo presenta el Aprendizaje por Refuerzo Adaptativo Justo Basado en la Viabilidad (FG-FARL), un procedimiento de aprendizaje por refuerzo fuera de línea que ajusta los umbrales de seguridad específicos del grupo para reducir el daño e igualar un objetivo de equidad seleccionado (alcance o daño) entre los subgrupos protegidos. Utilizando datos longitudinales anonimizados del Programa de Gestión de la Salud de la Población de Medicaid, evaluamos FG-FARL frente a la Replicación Conductual (BC) y HACO (Aprendizaje por Refuerzo Adaptativo Híbrido Fuera de Línea; Criterios de Seguridad Adaptativos Globales). Informamos estimaciones de valores fuera de política con intervalos de confianza del 95% con bootstrap y resultados de análisis de desequilibrio de subgrupos utilizando valores p. FG-FARL mejora las métricas de equidad al tiempo que alcanza valores comparables a las líneas de base, ofreciendo un enfoque práctico para un apoyo a la toma de decisiones más seguro y justo.

Takeaways, Limitations

Takeaways:
FG-FARL presenta un método práctico para mejorar simultáneamente la equidad y la seguridad en entornos de aprendizaje de refuerzo fuera de línea.
Demostramos que ajustar los umbrales de seguridad entre grupos puede reducir la inequidad entre subgrupos protegidos.
Verificamos la eficacia del algoritmo mediante experimentos utilizando datos médicos reales.
Limitations:
Dado que estos resultados se evaluaron en un conjunto de datos médicos específico, se necesita más investigación para determinar su generalización a otros dominios o conjuntos de datos.
Se debería examinar la aplicabilidad de otros conceptos de equidad distintos de las métricas de equidad utilizadas (cobertura o daño).
Debido a la naturaleza del aprendizaje de refuerzo fuera de línea, el desempeño en entornos reales requiere una verificación adicional.
👍