SCoRe는 대형 언어 모델(LLM) 에이전트의 복잡한 작업 해결 능력을 향상시키기 위해 고안된 학생 중심 프레임워크입니다. 이 프레임워크는 학생 모델이 훈련 궤적을 생성하고, 교사 모델은 학생의 초기 오류만 수정합니다. 이를 통해 학생의 능력에 맞는 훈련 데이터를 생성하고 특정 약점을 노출시킵니다. SCoRe는 수정된 궤적에 대한 학생 모델의 미세 조정과, 초기 오류 이전의 검증된 접두사에서 시작하여 해당 단계에서 목표 보상을 할당하는 단기 강화 학습을 포함합니다. SCoRe를 통해 7B 파라미터 학생 모델이 72B 파라미터 교사 모델의 에이전트 성능과 동등한 수준을 달성했습니다.