본 논문은 인공지능 분야의 난제인 새로운 수학 이론의 자동 발견을 위해 두 가지 핵심 단계를 제시한다. 첫째, 개념 발견 및 정리 증명을 위한 기호적 행동을 사용하는 강화 학습(RL) 환경인 $\emph{FERMAT}$를 도입하여 이론 발견과 관련된 다양한 RL 문제를 제시한다. 둘째, $\emph{FERMAT}$를 통해 수학적 대상의 $\emph{흥미로움}$을 자동으로 평가하는 특정 문제를 탐구한다. 특히, 함수 추상화를 특징으로 하는 LLM 기반 진화 알고리즘을 도입하여 초등 정수론 및 유한체 발견에서 하드 코딩된 기준선보다 상당한 개선을 보였다.