자동 에세이 채점(AES)에서 신뢰성 높은 점수만 공개하는 것은 중요한 윤리적 과제입니다. 본 연구는 신뢰도 추정을 분류 작업으로 설정하여 AES가 생성한 점수가 후보자를 적절한 CEFR 수준에 정확하게 배치했는지 여부를 예측합니다. 이진 결정이지만, 점수 구간화를 사용하여 n-ary 분류 문제로 재구성하고, CEFR 레이블의 순서 구조를 통합하는 새로운 Kernel Weighted Ordinal Categorical Cross Entropy (KWOCCE) 손실 함수를 도입하여 점수 도메인의 고유한 세분성을 활용합니다. 최고 성능 모델은 0.97의 F1 점수를 달성하여, 시스템이 100% CEFR 일치율로 점수의 47%를, 95% 이상의 CEFR 일치율로 99%를 공개할 수 있도록 합니다. 이는 모든 AM 예측 점수를 공개하는 독립형 AES 모델의 약 92% CEFR 일치율과 비교됩니다.