Este artículo evaluó un método para predecir la incidencia de eventos adversos graves (EAG) utilizando únicamente datos de registro de ensayos clínicos de ClinicalTrials.gov. Analizando datos de 22,107 ensayos comparativos de dos brazos, grupos paralelos, desarrollamos dos modelos: un modelo de clasificación para predecir si el grupo experimental tendría una mayor tasa de EAG que el grupo de control, y un modelo de regresión para predecir la tasa de EAG en el grupo de control. Se utilizaron modelos de lenguaje preentrenados, como ClinicalT5 y BioBERT, para la extracción de características, y se utilizó una técnica de ventana deslizante para procesar descripciones largas de ensayos. El modelo óptimo (ClinicalT5 + Transformer + MLP) logró un área bajo la curva (AUC) del 77.6% para predecir el grupo con una mayor tasa de EAG y un error cuadrático medio (RMSE) del 18.6% para predecir la tasa de EAG en el grupo de control. La técnica de ventana deslizante superó al método de comparación directa.