본 논문은 대규모 언어 모델(LLM)을 법적 추론에 적용하는 연구의 일환으로, 기존 법률 벤치마크의 한계를 극복하기 위해 실제 판결에 기반한 최초의 중국어 다단계 법적 추론 데이터세트인 MSLR을 소개합니다. MSLR은 IRAC 프레임워크를 기반으로 하며, 세분화된 단계별 추론 주석을 생성하기 위한 확장 가능한 Human-LLM 협업 주석 파이프라인을 설계했습니다. MSLR을 통해 LLM의 성능을 평가하고, 모델이 자체적으로 생성한 Self-Initiated Chain-of-Thought 프롬프트가 인간이 설계한 프롬프트보다 더 나은 추론 일관성과 품질을 보임을 확인했습니다. MSLR은 LLM 추론 및 Chain-of-Thought 전략 발전에 기여하며, 향후 연구를 위한 공개 자원을 제공합니다.