Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

¿Se pueden utilizar modelos lingüísticos de código abierto de gran tamaño para la documentación de tumores en Alemania? -- Una evaluación de las notas de los urólogos

Created by
  • Haebom

Autor

Stefan Lenz, Arsenij Ustjanzew, Marco Jeray, Meike Ressing, Torsten Panholzer

Describir

Este artículo presenta los resultados de una evaluación de 11 modelos de lenguaje a gran escala (LLM) de código abierto para mejorar el sistema alemán de registro manual de tumores. Se utilizaron LLM con entre 1 y 70 mil millones de parámetros para evaluar su rendimiento en tres tareas básicas: identificación del diagnóstico tumoral, asignación de código CIE-10 y extracción de la fecha del primer diagnóstico. Utilizando un conjunto de datos anotados generados a partir de notas anonimizadas de urólogos, se analizó el rendimiento de los modelos utilizando varias estrategias de incitación. Los modelos Llama 3.1 8B, Mistral 7B y Mistral NeMo 12B obtuvieron el mejor rendimiento, mientras que los modelos con menos de 7 mil millones de parámetros mostraron un rendimiento significativamente menor. La incitación con datos de campos médicos no urológicos mejoró significativamente el rendimiento, lo que sugiere que los LLM de código abierto tienen un potencial significativo para automatizar el registro tumoral. Concluimos que los modelos con entre 7 y 12 mil millones de parámetros ofrecen el equilibrio óptimo entre rendimiento y eficiencia de recursos. El código de evaluación y el conjunto de datos están disponibles públicamente.

Takeaways, Limitations

Takeaways:
Demuestra que un LLM de código abierto se puede utilizar de manera eficaz para automatizar la documentación de tumores en el campo de PNL médico alemán.
Los LLM con entre 7 y 12 mil millones de parámetros ofrecen un buen equilibrio entre rendimiento y eficiencia de recursos.
Presentamos la posibilidad de mejorar el rendimiento mediante el uso de diversas estrategias de estimulación y conjuntos de datos adicionales.
Se publica un nuevo conjunto de datos para abordar la escasez de datos en la PNL médica alemana.
Limitations:
La evaluación se limitó al campo de la urología y se necesitan más investigaciones para generalizar los hallazgos.
Se necesitan ajustes adicionales e investigación de ingeniería rápida para mejorar el rendimiento del modelo.
Los modelos con menos de 7 mil millones de parámetros tienen un rendimiento deficiente, lo que resalta la importancia de la escala del modelo.
👍