대규모 평가에 사용되는 자동 채점(AS) 시스템은 기존에 정확한 예측을 위해 많은 양의 수작업 채점 데이터가 필요한 작은 통계 모델을 사용해왔으며, 이는 시간과 비용이 많이 드는 작업입니다. 본 논문에서는 생성형 대규모 언어 모델이 적은 데이터로 새로운 작업에 일반화하는 인상적인 능력을 보여주는 점에 착안하여, 대규모 생성 모델(Teacher)이 소규모 모델(Student)을 교육하는 모델 증류 파이프라인을 제안합니다. Teacher는 훈련 데이터의 작은 부분집합으로 훈련되고, 나머지 훈련 데이터에 대한 점수를 제공하는 데 사용되며, 이는 Student를 훈련하는 데 사용됩니다. 이렇게 생성된 데이터셋을 "사이보그 데이터(Cyborg Data)"라고 부르며, 사람과 기계의 채점 응답을 결합한 것입니다. 본 연구 결과는 "사이보그 데이터"로 훈련된 Student 모델이 전체 데이터셋으로 훈련한 것과 비슷한 성능을 보이면서, 원래 수작업 채점 데이터의 10%만 필요함을 보여줍니다.