본 논문은 대규모 언어 모델(LLM)이 실제 학생처럼 불완전하고 반복적이며 스타일이 다양한 코드를 생성할 수 있는지 여부를 조사하는 ParaStudent 연구를 제시합니다. 여러 학기 동안 수집된 학생 제출물의 시간 순서 데이터셋을 사용하여, 저해상도 및 고해상도 실험을 설계하여 학생의 진행 상황을 모델링하고 의미론적, 기능적, 스타일적 차원에서 코드 출력을 평가했습니다. 미세 조정을 통해 실제 학생의 코드 작성 과정과 오류 패턴, 점진적 개선, 스타일 변화를 더욱 정확하게 포착하는 것을 확인했습니다. 결론적으로 현실적인 학생 코드 모델링에는 맥락 인식 생성, 시간 모델링, 다차원 평가를 통한 학습 역동성 포착이 필요함을 보여줍니다. 실험 및 평가 코드는 github.com/mmiroyan/ParaStudent 에서 확인 가능합니다.