Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Un nuevo modelo de lenguaje para predecir resultados de eventos adversos graves en ensayos clínicos a partir de sus registros prospectivos

Created by
  • Haebom

Autor

Qixuan Hu, Xumou Zhang, Jinman Kim, Florence Bourgeois, Adam G. Dunn

Describir

Este artículo evaluó un método para predecir la incidencia de eventos adversos graves (EAG) utilizando únicamente datos de registro de ensayos clínicos de ClinicalTrials.gov. Analizando datos de 22,107 ensayos comparativos de dos brazos, grupos paralelos, desarrollamos dos modelos: un modelo de clasificación para predecir si el grupo experimental tendría una mayor tasa de EAG que el grupo de control, y un modelo de regresión para predecir la tasa de EAG en el grupo de control. Se utilizaron modelos de lenguaje preentrenados, como ClinicalT5 y BioBERT, para la extracción de características, y se utilizó una técnica de ventana deslizante para procesar descripciones largas de ensayos. El modelo óptimo (ClinicalT5 + Transformer + MLP) logró un área bajo la curva (AUC) del 77.6% para predecir el grupo con una mayor tasa de EAG y un error cuadrático medio (RMSE) del 18.6% para predecir la tasa de EAG en el grupo de control. La técnica de ventana deslizante superó al método de comparación directa.

Takeaways, Limitations

Takeaways:
Demostramos que los datos de resultados resumidos de ClinicalTrials.gov se pueden utilizar para predecir la incidencia de eventos adversos graves en ensayos clínicos.
Sugiere la posibilidad de identificar discrepancias entre los resultados de seguridad esperados y los informados utilizando modelos predictivos.
Presentamos un método para procesar eficazmente representaciones semánticas de narrativas de ensayos clínicos utilizando modelos de lenguaje previamente entrenados y técnicas de ventana deslizante.
Tiene el potencial de contribuir a mejorar el diseño y el seguimiento de ensayos clínicos.
Limitations:
La precisión de predicción del modelo no es perfecta y los valores de AUC y RMSE aún tienen margen de mejora.
Los datos utilizados en el análisis se limitaron a los datos registrados en ClinicalTrials.gov, por lo que se necesita más investigación para determinar su generalización.
Se necesita una validación del desempeño de generalización para varios tipos de ensayos clínicos y eventos adversos graves.
Se necesita más investigación sobre la interpretabilidad de los modelos predictivos.
👍