APOLLOは、LeanコンパイラとLLMの推論能力を組み合わせて数学のクリーンアップを証明する自動化されたクリーンアップ証明システムです。従来のLLMベースのクリーンアップ証明方式は、多くのサンプリング(数千回)を介して検証システムを通過する証明を生成しますが、APOLLOはLLMが証明を生成し、エージェントが証明の構文エラーを修正し、Leanを使用して間違いを特定し、失敗した部分クリーンアップを分離し、自動ソルバーを活用し、残りの目標に対して低コストでLLMを使用します。変更された部分証明を再結合して再検証するプロセスを、ユーザー制御可能な最大試行回数まで繰り返します。 miniF2Fベンチマークでは、8B未満のパラメータモデルのうち84.9%の精度が達成され、サンプリングコストは100未満に維持されました。さらに、GoedelProverSFTの精度を65.6%に上げ、サンプルの複雑さを25,600から数百に減らしました。