Cet article a évalué une méthode de prédiction de l'incidence des événements indésirables graves (EIG) en utilisant uniquement les données d'enregistrement des essais cliniques de ClinicalTrials.gov. En analysant les données de 22 107 essais comparatifs à deux bras et groupes parallèles, nous avons développé deux modèles : un modèle de classification pour prédire si le groupe expérimental présenterait un taux d'EIG plus élevé que le groupe témoin, et un modèle de régression pour prédire le taux d'EIG dans le groupe témoin. Des modèles de langage pré-entraînés, tels que ClinicalT5 et BioBERT, ont été utilisés pour l'extraction de caractéristiques, et une technique de fenêtre glissante a été utilisée pour traiter les descriptions d'essais longues. Le modèle optimal (ClinicalT5+Transformer+MLP) a atteint une aire sous la courbe (ASC) de 77,6 % pour prédire le groupe présentant un taux d'EIG plus élevé et une erreur quadratique moyenne (RMSE) de 18,6 % pour prédire le taux d'EIG dans le groupe témoin. La technique de fenêtre glissante a surpassé la méthode de comparaison directe.