본 논문은 대규모 언어 모델(LLM)의 알고리즘 추론 능력에 대한 이해를 증진시키기 위해 대규모, 완전 공개, 복잡도 주석이 달린 1차 논리 추론 추적 데이터셋을 제시합니다. 이 데이터셋은 35억 토큰으로 구성되며, 880만 개의 LLM 증강 및 사람이 주석을 단 예시와 750만 개의 합성적으로 생성된 예시를 포함합니다. 각 합성 예시는 사용자 정의 자동 정리 증명기가 생성하며, 알고리즘 기원을 추적하는 메타데이터를 포함하여 검증 가능하게 정확합니다. 이 데이터셋은 LLM이 기호 추론 과정을 어떻게 학습하고 일반화하는지 연구하기 위한 확장 가능하고 해석 가능한 자료를 제공하여 현대 모델의 알고리즘 능력에 대한 더 투명하고 목표 지향적인 조사를 위한 길을 열어줍니다.