본 논문은 인공지능 추론을 위한 강화학습(RL) 기반 방법들의 높은 계산 비용 및 시간 소모 문제를 해결하고자, 자동 정리 증명(ATP) 과제에 초점을 맞춰 새로운 검증자 통합 설계를 제안합니다. 기존 방법들이 전체 추론 과정에 대한 피드백을 활용하는 것과 달리, 본 논문에서 제안하는 방법은 자동 검증자를 사용하여 추론 과정의 각 단계마다 중간 피드백을 제공합니다. Lean을 검증자로 사용하여 실험적으로 단계별 국소 검증이 모델의 추론 정확도와 효율성을 전반적으로 향상시킨다는 것을 보여줍니다.