본 연구는 Moodle의 다지선다형 문제 생성 자동화 AI 플러그인인 OneClickQuiz에 Bloom의 분류체계를 통합하는 것을 평가합니다. Bloom의 분류체계는 교육 목표를 계층적 인지 수준으로 분류하는 구조적 프레임워크를 제공합니다. 연구는 이 분류체계를 통합하여 AI가 생성한 질문과 특정 인지 목표 간의 정합성을 향상시킬 수 있는지 조사합니다. Bloom의 수준에 따라 분류된 3691개의 질문 데이터 세트를 개발하고 다항 로지스틱 회귀, Naive Bayes, 선형 서포트 벡터 분류(SVC), Transformer 기반 모델(DistilBERT) 등 다양한 분류 모델을 사용하여 질문 분류 효과를 평가했습니다. 결과는 높은 Bloom 수준이 일반적으로 질문 길이, Flesch-Kincaid Grade Level (FKGL), 어휘 밀도 (LD) 증가와 상관관계가 있음을 나타내며, 이는 높은 인지적 요구의 복잡성 증가를 반영합니다. 다항 로지스틱 회귀는 Bloom의 수준에 따라 정확도가 다르게 나타났으며, "지식" 수준에서 가장 우수하고 고차원 수준에서는 정확도가 낮았습니다. 고차원 범주를 병합하면 복잡한 인지 과제에 대한 정확도가 향상되었습니다. Naive Bayes와 선형 SVC도 하위 수준에 대한 효과적인 분류를 보였지만 고차원 과제에서는 어려움을 겪었습니다. DistilBERT는 하위 및 고차원 인지 수준 모두의 분류를 크게 개선하여 전체 검증 정확도 91%를 달성하며 가장 높은 성능을 달성했습니다. 본 연구는 AI 기반 평가 도구에 Bloom의 분류체계를 통합할 가능성을 강조하고 교육 콘텐츠 생성 향상을 위한 DistilBERT와 같은 고급 모델의 장점을 강조합니다.