Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Modelos lingüísticos para profesionales de la salud: estructuración de transcripciones de voz en dos aplicaciones clínicas reales

Created by
  • Haebom

Autor

Jean-Philippe Corbeil, Asma Ben Abacha, George Michalopoulos, Phillip Swazinna, Miguel Del-Agua, Jerome Tremblay, Akila Jeeson Daniel, Cari Bader, Yu-Cheng Cho, Pooja Krishnan, Nathan Bodenstab, Thomas Lin, Wenxuan Teng, Francois Beaulieu, Paul Vozila

Describir

Si bien los modelos de lenguaje a gran escala (LLM), como GPT-4o y o1, han demostrado un rendimiento excepcional en tareas clínicas de procesamiento del lenguaje natural (PLN) en diversos parámetros de referencia del sector salud, dos tareas importantes de PLN —informes tabulares estructurados a partir de dictados de enfermería y extracción de comandos médicos de consultas médico-paciente— siguen siendo poco estudiadas debido a la escasez de datos y la sensibilidad. En este artículo, estudiamos estas dos tareas utilizando conjuntos de datos clínicos privados y de código abierto, evaluamos el rendimiento de los LLM de código abierto y cerrados, y analizamos las fortalezas y limitaciones de cada modelo. Además, proponemos una canalización basada en agentes para generar dictados de enfermería realistas y no sensibles que permitan la extracción estructurada de observaciones clínicas. Para respaldar la investigación relacionada, publicamos SYNUR y SIMORD, los primeros conjuntos de datos de código abierto para la extracción de observaciones de enfermería y la extracción de comandos médicos, respectivamente.

Takeaways, Limitations

Takeaways:
Explorando el potencial del LLM para los informes orales de enfermería y la extracción de órdenes médicas.
Proponemos una canalización basada en agentes para resolver dos tareas.
Apoyo a la investigación mediante la publicación de conjuntos de datos de código abierto (SYNUR, SIMORD).
Reduce la carga de documentación del personal médico y les permite centrarse en la atención al paciente.
Limitations:
Limitaciones del estudio debido a la insuficiencia de datos y sensibilidad.
Dependencia del rendimiento y limitaciones de un LLM específico.
Se necesitan más investigaciones para determinar la aplicabilidad del proceso basado en agentes propuesto a entornos clínicos del mundo real.
Consideraciones sobre la calidad y representatividad de los conjuntos de datos de código abierto.
👍