Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Evaluación de la generación aumentada por recuperación frente a la entrada de contexto largo para el razonamiento clínico en HCE

Created by
  • Haebom

Autor

Skatje Myers, Dmitriy Dligach, Timothy A. Miller, Samantha Barr, Yanjun Gao, Matthew Churpek, Anoop Mayampurath, Majid Afshar

Describir

Este artículo presenta un estudio que aprovecha los modelos de lenguaje a gran escala (LLM) y las técnicas de generación aumentada por búsqueda (RAG) para abordar los desafíos de los textos extensos, confusos y redundantes en las historias clínicas electrónicas (HCE). Para abordar la limitada ventana de contexto de los LLM existentes, utilizamos RAG para recuperar fragmentos relevantes para cada tarea de la HCE completa y aplicarlo a tres tareas clínicas: extracción de procedimientos de imagen, generación de un programa de antibióticos e identificación de diagnósticos principales. Utilizando datos reales de HCE de pacientes hospitalizados, evaluamos tres LLM de vanguardia con diferentes niveles de contexto. Demostramos que el rendimiento de RAG es similar o superior al de los métodos que utilizan solo historias clínicas recientes, logrando un rendimiento comparable al contexto completo con significativamente menos tokens de entrada. Esto sugiere que RAG sigue siendo un enfoque competitivo y eficiente, incluso con la aparición de nuevos modelos capaces de gestionar textos más extensos.

Takeaways, Limitations

Takeaways:
Demostramos que la técnica RAG puede resolver eficazmente el problema del texto largo en los EHR.
Presentamos tres desafíos clínicos que se pueden aplicar en múltiples sistemas de atención médica con un mínimo esfuerzo.
Superar las limitaciones de la ventana de contexto de LLM y presentar la posibilidad de extracción e inferencia de información eficiente.
Sugiere que la técnica RAG puede mantener su competitividad en futuros LLM más avanzados.
Limitations:
Limitaciones en la generalización de los datos de EHR utilizados en sistemas de atención sanitaria específicos.
Se necesita investigación adicional sobre diversas enfermedades y características de los pacientes.
Se necesita más análisis sobre la estrategia de búsqueda de la técnica RAG y los cambios de rendimiento según la selección de LLM.
Se necesita validación adicional y evaluación de seguridad para la aplicación clínica real.
👍