본 논문은 대규모 추론 모델(LRMs)의 교육적 활용을 위한 새로운 프레임워크인 Pedagogy-R1을 제안합니다. Pedagogy-R1은 (1) 지도 학습을 위한 모델 출력 필터링 및 개선을 위한 증류 기반 파이프라인, (2) 과목 지식, 교육학적 지식, 추적, 에세이 채점 및 교사 의사결정을 평가하는 균형 잡힌 교육 벤치마크(WBEB), 그리고 (3) 교사 스타일의 추론을 생성하고 유도하는 Chain-of-Pedagogy (CoP) 프롬프팅 전략의 세 가지 혁신을 통해 LRMs를 교실 환경에 적용합니다. 혼합 방법론적 평가를 통해 LRMs의 교육적 강점과 한계에 대한 최초의 체계적인 평가를 제공합니다.
시사점, 한계점
•
시사점:
◦
대규모 추론 모델을 교육 환경에 적용하기 위한 새로운 프레임워크(Pedagogy-R1) 제시.
◦
모델 출력의 질을 향상시키는 증류 기반 파이프라인 개발.
◦
교육적 측면을 종합적으로 평가하는 새로운 벤치마크(WBEB) 제시.
◦
교사 스타일의 추론을 효과적으로 유도하는 Chain-of-Pedagogy (CoP) 프롬프팅 전략 제안.
◦
LRMs의 교육적 강점과 한계에 대한 체계적인 평가 제공.
•
한계점:
◦
Pedagogy-R1의 일반화 가능성 및 다양한 교육 환경에 대한 적용성에 대한 추가 연구 필요.