대규모 언어 모델(LLM)을 활용하여 교육의 지속적인 과제인 객관적이고 확장 가능한 교육의 질 측정을 시도함. 문장 수준 임베딩 기반의 사용자 정의 LLM을 사용하여 기존의 subword 토큰화 방식보다 교실 수업 녹취록의 장문 및 해석적 특성에 더 적합한 아키텍처를 구현함. 데이터 효율적인 훈련 방식을 통해 다양한 문장 임베딩을 체계적으로 평가하고, 전문적인 인간 평가 수준 또는 그 이상의 성능을 달성함을 보임. 모델은 수업 수준의 특징에 더 많은 점수 변동성을 부여하며, 교사 가치 부가 측정치와도 일치하는 결과를 보임.