Verifier-Backed Hard Problem Generation for Mathematical Reasoning

작성자

Haebom

카테고리

Empty

저자

Yuhang Lai, Jiazhan Feng, Yee Whye Teh, Ning Miao

💡 개요

본 논문은 LLM이 유효하고 도전적인 수학 문제를 생성하는 데 어려움을 겪는 문제를 해결하기 위해 Verifier-Backed Hard Problem Generation (VHG) 프레임워크를 제안합니다. VHG는 독립적인 검증자(verifier)를 문제 생성자(setter)와 해결자(solver)의 삼자 셀프 플레이(three-party self-play)에 통합하여, 문제의 유효성과 난이도를 동시에 고려하도록 합니다. 실험 결과, VHG는 기존 방법론 대비 명확하게 우수한 성능을 보였습니다.

🔑 시사점 및 한계

•

LLM 기반 수학 문제 생성에서 검증자의 도입은 문제의 유효성과 난이도 균형을 맞추는 데 효과적인 전략입니다.

•

하드/소프트 검증자 모두 적용 가능함을 보여주며, 다양한 수학적 추론 작업에 대한 일반화 가능성을 제시합니다.

•

현재는 주로 적분 및 일반 수학 추론 작업에 대한 평가가 이루어졌으며, 더 복잡하거나 새로운 분야의 문제 생성에 대한 확장 및 검증이 필요합니다.

PDF 보기

Made with Slashpage