본 논문은 교육 평가의 자동 채점을 위한 연합 학습(Federated Learning, FL) 프레임워크를 제안합니다. 기존의 중앙화된 데이터 수집 방식의 데이터 유출 위험과 높은 로지스틱 부담을 해결하기 위해, 각 학교(클라이언트)에서 로컬 학습을 수행하고 최적화된 모델 업데이트만 공유하는 방식을 제시합니다. 대규모 언어 모델(LLM)의 매개변수 효율적인 미세 조정 기법인 LoRA와 클라이언트 성능 및 데이터 양을 고려한 가중치 적응형 집계 전략을 사용하여 데이터 이질성 문제를 해결합니다. 9개 중학교의 NGSS 기반 다중 레이블 과학 평가 데이터를 사용하여 기존의 FL 방법과 중앙 학습 기준 모델과 비교 평가한 결과, 제안된 모델이 FL 접근 방식 중 가장 높은 정확도(94.5%)를 달성하고 중앙 학습 모델과의 성능 차이가 0.5~1.0%p 이내임을 보였습니다. 또한, 루브릭 수준 채점 정확도 또한 유사하며, 루브릭 일치율 차이가 1.3%에 불과하고 평균 절대 오차(MAE)가 낮아 예측 품질과 해석력을 모두 유지하는 효과를 보였습니다.