Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Reconstrucción de trayectorias de sepsis a partir de informes de casos clínicos mediante LLM: el corpus de series temporales textuales para la sepsis

작성자
  • Haebom

Autor

Shahriar Noroozizadeh, Jeremy C. Weiss

Describir

Este artículo presenta un proceso para la extracción y anotación de hallazgos clínicos de registros de pacientes (informes de casos) a lo largo del tiempo mediante modelos de lenguaje a gran escala (LLM) para el análisis de series temporales de datos de atención médica. Construimos un corpus de series temporales de texto de 2139 registros de pacientes con sepsis (Sepsis-3) del subconjunto PubMed Open Access (PMOA) y validamos el sistema mediante comparación con el conjunto de datos I2B2/MIMIC-IV. Utilizando los modelos O1-preview y Llama 3.3 70B Instruct, demostramos una alta tasa de coincidencia de eventos (~0,75) y una concordancia sólida (~0,93). Sin embargo, destacamos las limitaciones de los LLM en la reconstrucción temporal, sugiriendo posibles mejoras mediante la integración multimodal.

Takeaways, Limitations

Takeaways:
Demostramos que se pueden utilizar modelos de lenguaje a gran escala para extraer y anotar eficazmente hallazgos clínicos a lo largo del tiempo a partir de registros médicos.
La generación automatizada de series temporales de datos médicos ofrece el potencial de desarrollar análisis médicos y modelos predictivos más sofisticados.
Contribuir a la activación de la investigación médica proporcionando un corpus de series temporales de texto según el tiempo de acceso abierto.
Limitations:
Existen limitaciones en las capacidades de reconstrucción temporal de LLM.
Se plantea la necesidad de mejorar el rendimiento mediante la integración de datos multimodales.
Es necesaria una revisión más profunda de la generalización del conjunto de datos utilizado para evaluar el desempeño del modelo.
👍