Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo. La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro. Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.
Conjunto multiagente basado en modelos de lenguaje de gran tamaño para mitigar las alucinaciones y la anotación eficiente de la fibrilación auricular en informes de ECG.
Created by
Haebom
Autor
Jingwei Huang, Kuroush Nezafati, Ismael Villanueva-Miranda, Zifan Gu, Yueshuang Xu, Ann Marie Navar, Tingyi Wanyan, Qin Zhou, Bo Yao, Ruichen Rong, Xiaowei Zhan, Guanghua Xiao, Eric D. Peterson, Donghan M. Yang, Wenqi Shi, Yang Xie
Describir
En este estudio, presentamos un método de conjunto multiagente basado en LLM para resolver los problemas de alucinaciones y etiquetado de datos en conjuntos de datos de HCE a gran escala. El etiquetado manual requiere experiencia, mucho tiempo, coste y esfuerzo, y es propenso a errores. Para superar estos problemas, desarrollamos un método de conjunto utilizando varios LLM de código abierto y lo aplicamos a dos tareas prácticas: etiquetar un conjunto de datos de ECG a gran escala de MIMIC-IV e identificar los determinantes sociales de la salud (DSS) en los registros médicos de HCE. Utilizamos un mecanismo de votación mayoritaria que considera la predicción de cada LLM como un voto y aplica un umbral mínimo de victoria. Logramos una precisión de aproximadamente el 98,2 % en el etiquetado del conjunto de datos de ECG de MIMIC-IV (623 566 informes de ECG) y mostramos un rendimiento competitivo en la identificación de DSS en la sección de historia social de 1405 registros médicos de HCE. El LLM de conjunto supera a los LLM individuales e incluso a los mejores LLM comerciales, y reduce los errores de alucinaciones.
Takeaways, Limitations
•
Takeaways:
◦
Reduce significativamente el tiempo y el esfuerzo necesarios para el etiquetado de datos de EHR a gran escala, proporcionando un proceso automatizado con alta precisión y calidad.
◦
Como se ve en el ejemplo de aplicación de identificación SDOH, se generaliza bien a otras tareas de etiquetado de datos de texto.
◦
Un conjunto de diferentes LLM puede superar o incluso igualar el desempeño de los mejores LLM individuales.
◦
Los métodos de conjunto reducen significativamente los errores de alucinación.
◦
Proporciona una solución de etiquetado de datos escalable y eficiente.
•
Limitations:
◦
No hay mención explícita de Limitations en el artículo presentado en este estudio (se necesita confirmar mediante análisis adicionales u otros estudios).