본 논문은 대규모 언어 모델(LLM)의 해석 가능성을 개선하기 위한 새로운 관점으로 부상한 언어 습득을 연구하며, 특히 중국어 학습(SLA)에 초점을 맞춘다. 인간 학습자를 통제하는 실험의 윤리적, 실용적 어려움을 해결하기 위해 LLM을 활용한 중국어 SLA 모델링 및 평가를 위한 HSKBenchmark를 제시한다. HSK 레벨 3부터 6까지를 포괄하며, 실제 교재, 합성 튜닝 샘플, 테스트 토픽 및 언어학적 평가 시스템을 포함한다. 또한, 학습 궤적을 시뮬레이션하기 위해 커리큘럼 튜닝 프레임워크를 도입하고, HSKAgent를 구축했다.