본 논문은 교실 담화의 질을 자동으로 평가하는 새로운 텍스트 중심의 다중 모달 융합 아키텍처를 제안합니다. Global Teaching InSights (GTI) 관찰 프로토콜을 기반으로 담화의 성격, 질문, 설명 등 세 가지 담화 구성 요소의 질을 평가하는 모델을 개발했습니다. 주요 기술로는 주의 메커니즘을 이용한 모달 간 및 모달 내 상호작용 포착, 다중 작업 학습을 통한 세 구성 요소의 질 점수 예측, 그리고 순서형 분류 문제로의 공식화가 사용되었습니다. 독일 GTI 데이터셋(수학 수업 92개)을 사용한 실험 결과, 텍스트 모달의 중요성을 확인했으며, 음향 특징 통합을 통해 인간 평가자의 신뢰도(0.326)에 근접한 Quadratic Weighted Kappa 점수 0.384를 달성했습니다. 이 연구는 교사의 전문성 개발을 지원하는 자동화된 담화 질 평가 시스템 개발의 기반을 마련합니다.