Cet article présente un nouveau cadre d'automatisation de l'arbitrage des événements cardiovasculaires dans les essais cliniques sur les maladies cardiovasculaires, à l'aide de modèles de langage à grande échelle (MLL). Pour remédier à la variabilité inter-arbitres, chronophage et gourmande en ressources, des méthodes d'arbitrage manuelles traditionnelles, nous développons une approche en deux étapes : un pipeline basé sur les LLM pour l'extraction d'informations sur les événements à partir de données cliniques non structurées, et un processus d'arbitrage basé sur les LLM, guidé par l'approche Tree of Thoughts et les recommandations du Clinical Endpoints Committee (CEC). En utilisant des données d'essais cliniques spécifiques aux événements cardiovasculaires, nous obtenons un score F1 de 0,82 pour l'extraction des événements et une précision de 0,68 pour l'arbitrage. Nous présentons également une nouvelle mesure automatisée, le score CLEART, spécialement conçue pour évaluer la qualité des inférences cliniques générées par l'IA dans l'arbitrage des événements cardiovasculaires. Cette approche démontre le potentiel de réduction significative du temps et des coûts d'arbitrage tout en maintenant des résultats de haute qualité, cohérents et vérifiables dans les essais cliniques. En réduisant la variabilité et en améliorant la standardisation, nous pouvons identifier et atténuer plus rapidement les risques associés aux thérapies cardiovasculaires.