LeanProgress: Guiding Search for Neural Theorem Proving via Proof Progress Prediction

작성자

Haebom

카테고리

비어 있음

저자

Suozhi Huang, Peiyang Song, Robert Joseph George, Anima Anandkumar

개요

본 논문은 대규모 언어 모델(LLM)이 수학적 추론에서 겪는 어려움, 특히 환각(hallucination) 문제를 해결하기 위해 Lean과 같은 형식적 증명 보조기를 활용하는 방법을 제시합니다. Lean과 LLM을 결합하면 신뢰할 수 있는 정리 증명이 가능하지만, 긴 증명과 복잡한 수학적 형식화에는 여전히 어려움을 겪습니다. 본 논문에서는 LeanProgress라는 방법을 제시하여 증명 과정의 진행 상황을 예측합니다. Lean Workbook Plus와 Mathlib4의 대규모 Lean 증명 데이터셋을 사용하여 모델을 학습 및 평가하였으며, 증명 길이의 불균형 분포를 해결하기 위해 데이터 전처리 및 균형 조정 기법을 적용했습니다. 실험 결과, LeanProgress는 증명 진행 상황 및 남은 단계 수 예측에서 75.1%의 정확도를 달성하였으며, Reprover를 사용한 최선우선탐색 프레임워크에 통합하여 Mathlib4에서 기준 성능(41.2%) 대비 3.8% 향상된 성능을 보였습니다. 특히 긴 증명에서 효과적임을 확인했습니다.