Presentamos un novedoso marco de ajuste fino llamado DualDistill. Este marco sintetiza estrategias de inferencia complementarias de múltiples modelos de profesor para producir un modelo integrado de estudiante. En concreto, combina las ventajas de los modelos de procesos de pensamiento a largo plazo (Long-CoT), que destacan en el razonamiento matemático, con las de los agentes asistidos por herramientas, que gestionan operaciones aritméticas mediante la ejecución de código. El modelo Agentic-R1 selecciona dinámicamente la estrategia óptima (razonamiento basado en herramientas o basado en texto) para cada consulta, lo que mejora la precisión tanto en problemas computacionalmente intensivos como en los estándares de referencia.