본 논문은 수학 형식화 과정에서, 특히 경험이 부족한 사용자에게 어려운 과정인 전제 선택 문제를 해결하기 위한 새로운 방법을 제시한다. 기존의 언어 모델 기반 접근 방식은 데이터 부족 문제에 직면하지만, 본 연구는 BERT 모델을 이용하여 증명 상태와 전제를 공유된 잠재 공간에 임베딩하는 방법을 제안한다. 대조 학습 프레임워크 내에서 훈련되며, 도메인 특화 토크나이저와 세분화된 유사도 계산 방법을 통합한다. 실험 결과, 제안된 모델은 기존 기준 모델에 비해 경쟁력이 높으며, 적은 계산 자원으로 강력한 성능을 달성함을 보여준다. 재순위 지정 모듈을 통합하여 성능을 더욱 향상시켰으며, Mathlib 정리를 증명 상태를 사용하여 직접 쿼리할 수 있는 검색 엔진을 공개하여 형식화 과정을 간소화하고 접근성과 효율성을 크게 향상시킬 예정이다. 코드는 https://github.com/ruc-ai4math/Premise-Retrieval 에서 이용 가능하다.