Hunyuan 7B를 기반으로 LEAN4를 사용한 대화형 자동 정리 증명을 위해 미세 조정된 언어 모델 HunyuanProver를 소개합니다. 데이터 부족 문제를 완화하기 위해 저렴한 비용으로 데이터를 반복적으로 합성하는 확장 가능한 프레임워크를 설계했습니다. 또한, 증명자의 효과적인 "시스템 2 사고"를 가능하게 하는 안내 트리 검색 알고리즘을 설계했습니다. HunyuanProver는 주요 벤치마크에서 최첨단(SOTA) 성능을 달성합니다. 구체적으로, miniF2F-test에서 현재 SOTA 결과인 65.9%에 비해 68.4%의 통과율을 달성했습니다. miniF2F-test에서 4개의 IMO 명제(imo_1960_p2, imo_1962_p2, imo_1964_p2, imo_1983_p6)를 증명했습니다. 커뮤니티에 도움이 되도록 자연어로 된 원래 질문, 자동 공식화에 의해 변환된 명제, HunyuanProver에 의한 증명을 포함하는 30,000개의 합성 인스턴스 데이터셋을 오픈 소스로 공개할 예정입니다.