Este artículo presenta DrugReasoner, un modelo de lenguaje a gran escala basado en inferencias, diseñado para optimizar las inversiones en investigación mediante la predicción temprana de los resultados de aprobación de fármacos. Desarrollado sobre la arquitectura LLaMA y optimizado con la optimización de políticas relativas a grupos (GRPO), DrugReasoner integra descriptores moleculares con inferencia comparativa para generar predicciones, junto con evidencia paso a paso y puntuaciones de confianza, comparando compuestos aprobados y no aprobados con estructuras similares. Alcanza un AUC de 0,732 y una puntuación F1 de 0,729 en el conjunto de validación, y un AUC de 0,725 y una puntuación F1 de 0,718 en el conjunto de prueba, superando así a modelos de referencia existentes como la regresión logística, SVM y k-NN, y compitiendo con XGBoost. En un conjunto de datos externo independiente, DrugReasoner también supera al modelo ChemAP con un AUC de 0,728 y una puntuación F1 de 0,774, manteniendo una alta precisión y una sensibilidad equilibrada, lo que demuestra su robustez en situaciones reales. DrugReasoner no solo ofrece una precisión de predicción competitiva, sino que también aumenta la transparencia a través de los resultados de inferencia, abordando un cuello de botella clave en el desarrollo de fármacos asistido por IA.