APOLLO es un sistema automatizado de demostración de teoremas que combina el compilador Lean y la capacidad de razonamiento de LLM para demostrar teoremas matemáticos. Mientras que los métodos convencionales de demostración de teoremas basados en LLM generan pruebas que superan los sistemas de verificación mediante numerosos (miles) muestreos, APOLLO utiliza un flujo de trabajo modular en el que LLM genera pruebas, los agentes corrigen errores sintácticos en las pruebas, Lean identifica errores, aísla subteoremas fallidos, utiliza un solucionador automático y ejecuta LLM de forma económica en los objetivos restantes. Este proceso de recombinación y reverificación de las subpruebas corregidas se repite hasta un número máximo de intentos controlable por el usuario. En el benchmark miniF2F, alcanza una precisión del 84,9 % en modelos con menos de 8 000 millones de parámetros, manteniendo un coste de muestreo inferior a 100. Además, mejora la precisión de GoedelProverSFT al 65,6 % y reduce la complejidad de la muestra de 25 600 a varios cientos.