# Analyzing Feedback Mechanisms in AI-Generated MCQs: Insights into Readability, Lexical Properties, and Levels of Challenge

### 저자

Antoun Yaacoub, Zainab Assaghir, Lionel Prevost, Jerome Da-Rugna

### 개요

본 논문은 Google Gemini 1.5-flash 텍스트 모델이 생성한 컴퓨터 과학 객관식 문제(MCQ)에 대한 피드백의 언어적 특성을 분석합니다. 1,200개 이상의 MCQ 데이터셋을 사용하여, 문제 난이도(쉬움, 중간, 어려움) 및 피드백 어조(지원적, 중립적, 도전적) 세 가지 수준을 고려하여 피드백의 길이, 가독성 점수(Flesch-Kincaid Grade Level), 어휘 풍부함, 어휘 밀도 등 주요 언어 지표를 분석했습니다.  RoBERTa 기반의 미세 조정된 다중 작업 학습(MTL) 모델을 훈련하여 이러한 언어적 특성을 예측하고, 가독성에 대해 2.0, 어휘 풍부함에 대해 0.03의 평균 절대 오차(MAE)를 달성했습니다.  피드백 어조와 문제 난이도 간의 상호 작용 효과가 중요하게 나타났으며, 이는 다양한 교육 환경에서 AI 생성 피드백의 동적 적응을 보여줍니다.  결과적으로, 개인화되고 효과적인 AI 기반 피드백 메커니즘 개발에 기여하며, 설계 및 배포 시 윤리적 고려 사항의 중요성을 강조합니다.

### 시사점, 한계점

- **시사점:**

    - AI 생성 피드백의 언어적 특성(가독성, 어휘 풍부함 등)에 대한 심층적 이해를 제공합니다.

    - AI 피드백이 문제 난이도와 어조에 따라 동적으로 적응한다는 것을 보여줍니다.

    - 더욱 개인화되고 효과적인 AI 기반 피드백 메커니즘 개발에 기여할 수 있습니다.

    - AI 기반 교육 피드백 시스템 설계 및 구현 시 윤리적 고려 사항의 중요성을 강조합니다.

    - RoBERTa 기반 MTL 모델을 활용한 언어적 특성 예측의 효용성을 제시합니다.

- **한계점:**

    - 분석 대상이 컴퓨터 과학 MCQ에 국한되어 일반화 가능성에 제한이 있습니다.

    - 특정 AI 모델(Gemini 1.5-flash)에 대한 분석 결과이므로 다른 AI 모델의 결과와의 비교가 필요합니다.

    - MAE 값만 제시되었고, 모델의 성능에 대한 추가적인 평가 지표가 부족합니다.

    - 윤리적 고려 사항에 대한 구체적인 논의가 부족합니다.

[PDF 보기](https://arxiv.org/pdf/2504.21013)

![https://i.imgur.com/UeFoc68.jpeg](https://i.imgur.com/UeFoc68.jpeg)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).