2024-2025년 대규모 언어 모델의 정리 증명 능력에 대한 연구가 진행되었으며, 본 논문에서는 GPT-5 모델의 여러 인스턴스를 활용한 협업 프로토콜을 통해 ChatGPT가 달성한 정리 증명 성과를 보고한다. 특히, 2025년 국제 수학 올림피아드(IMO) 문제 6개 중 5개를 해결하고, [Cohen, Journal of Integer Sequences, 2025]에 제시된 66개의 정수론 추측 중 약 1/3을 증명했다. 생성된 증명의 환각(hallucination)을 방지하기 위해 Lean 증명 보조 도구를 사용하여 최종 증명을 공식적으로 검증하고, 인간 검토자가 Lean 코드의 전제와 결론의 일치를 확인했다.