Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Un nouveau modèle de langage pour prédire les résultats des événements indésirables graves dans les essais cliniques à partir de leurs enregistrements prospectifs

Created by
  • Haebom

Auteur

Qixuan Hu, Xumou Zhang, Jinman Kim, Florence Bourgeois, Adam G. Dunn

Contour

Cet article a évalué une méthode de prédiction de l'incidence des événements indésirables graves (EIG) en utilisant uniquement les données d'enregistrement des essais cliniques de ClinicalTrials.gov. En analysant les données de 22 107 essais comparatifs à deux bras et groupes parallèles, nous avons développé deux modèles : un modèle de classification pour prédire si le groupe expérimental présenterait un taux d'EIG plus élevé que le groupe témoin, et un modèle de régression pour prédire le taux d'EIG dans le groupe témoin. Des modèles de langage pré-entraînés, tels que ClinicalT5 et BioBERT, ont été utilisés pour l'extraction de caractéristiques, et une technique de fenêtre glissante a été utilisée pour traiter les descriptions d'essais longues. Le modèle optimal (ClinicalT5+Transformer+MLP) a atteint une aire sous la courbe (ASC) de 77,6 % pour prédire le groupe présentant un taux d'EIG plus élevé et une erreur quadratique moyenne (RMSE) de 18,6 % pour prédire le taux d'EIG dans le groupe témoin. La technique de fenêtre glissante a surpassé la méthode de comparaison directe.

Takeaways, Limitations

Takeaways:
Nous démontrons que les données récapitulatives des résultats de ClinicalTrials.gov peuvent être utilisées pour prédire l’incidence des EIG dans les essais cliniques.
Suggère la possibilité d’identifier les écarts entre les résultats de sécurité attendus et rapportés à l’aide de modèles prédictifs.
Nous présentons une méthode permettant de traiter efficacement les représentations sémantiques des récits d’essais cliniques à l’aide de modèles de langage pré-entraînés et de techniques de fenêtre coulissante.
A le potentiel de contribuer à l’amélioration de la conception et du suivi des essais cliniques.
Limitations:
La précision de prédiction du modèle n’est pas parfaite et les valeurs AUC et RMSE peuvent encore être améliorées.
Les données utilisées dans l’analyse étaient limitées aux données enregistrées dans ClinicalTrials.gov, des recherches supplémentaires sont donc nécessaires pour déterminer la généralisabilité.
La validation des performances de généralisation est nécessaire pour différents types d’essais cliniques et d’événements indésirables graves.
Des recherches supplémentaires sont nécessaires sur l’interprétabilité des modèles prédictifs.
👍