Cet article présente DrugReasoner, un modèle de langage à grande échelle basé sur l'inférence, conçu pour optimiser les investissements en recherche en prédisant précocement les résultats d'approbation des médicaments. Basé sur l'architecture LLaMA et optimisé par l'optimisation des politiques relatives de groupe (GRPO), DrugReasoner intègre des descripteurs moléculaires à l'inférence comparative pour générer des prédictions, ainsi que des preuves étape par étape et des scores de confiance, en comparant des composés approuvés et non approuvés de structures similaires. Il atteint une ASC de 0,732 et un score F1 de 0,729 sur l'ensemble de validation, et une ASC de 0,725 et un score F1 de 0,718 sur l'ensemble de test, surpassant ainsi les modèles de référence existants tels que la régression logistique, SVM et k-NN, et se montrant compétitif face à XGBoost. Sur un ensemble de données externes indépendantes, DrugReasoner surpasse également le modèle ChemAP avec une AUC de 0,728 et un score F1 de 0,774, conservant ainsi une précision élevée et une sensibilité équilibrée, démontrant ainsi sa robustesse dans des scénarios réels. DrugReasoner offre non seulement une précision de prédiction compétitive, mais améliore également la transparence grâce aux résultats d'inférence, ce qui permet de résoudre un obstacle majeur au développement de médicaments assisté par l'IA.