본 논문은 다중 모드 평가의 증가 추세 속에서 자동 에세이 채점(AES)의 중요성을 강조하며, 기존 AES 방법의 일반화 및 다중 모달 인식의 어려움과 최신 다중 모달 대규모 언어 모델(MLLM) 기반 접근 방식의 환각적 정당화 및 인간 판단과의 불일치 문제를 지적합니다. 이러한 한계를 해결하기 위해, 논문에서는 최초의 협업 다중 에이전트 프레임워크인 CAFES를 제안합니다. CAFES는 신속한 특징별 평가를 담당하는 초기 채점자, 상세하고 증거 기반의 강점을 집계하는 피드백 풀 관리자, 그리고 이 피드백을 기반으로 점수를 반복적으로 개선하여 인간 판단과의 일치도를 높이는 반성적 채점자의 세 가지 특수화된 에이전트로 구성됩니다. 최첨단 MLLM을 사용한 광범위한 실험 결과, 기준점 대비 평균 21%의 이차 가중 카파(QWK) 향상을 달성했으며, 특히 문법 및 어휘 다양성 측면에서 두드러지는 성과를 보였습니다. 제안된 CAFES 프레임워크는 지능형 다중 모달 AES 시스템을 위한 길을 열어줍니다.