본 논문은 인간과 인공지능 모두에게 점점 중요해지고 있는 질문의 질에 대한 종합적인 평가 연구가 부족하다는 점을 지적하며, 질문의 질을 정의하고 체계적인 평가 프레임워크를 제시한다. 적절성(맥락에서의 사회언어적 능력)과 효과성(목표 달성에서의 전략적 능력)이라는 두 가지 주요 평가 차원을 제안하고, 이를 기반으로 루브릭 기반 채점 시스템을 개발하였다. 동적인 맥락 변수를 통합하여 반자동 적응 기준을 통해 구조와 유연성을 확보한 평가 프레임워크는 CAUS 및 SQUARE 데이터셋을 사용하여 검증되었으며, 다양한 맥락에 적응하면서 잘 구성된 질문과 문제가 있는 질문 모두를 평가할 수 있음을 보여준다. 본 연구는 질문 행위를 질문의 본질적인 특성에 기반한 구조적 분석 방법과 통합하는 데 중요한 발걸음을 내딛는다.