Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Automated Knowledge Component Generation and Knowledge Tracing for Coding Problems

Created by
  • Haebom

저자

Zhangqi Duan, Nigel Fernandez, Arun Balajiee Lekshmi Narayanan, Mohammad Hassany, Rafaella Sampaio de Alencar, Peter Brusilovsky, Bita Akram, Andrew Lan

개요

본 논문은 온라인 학습 플랫폼에서 개인화된 학습 및 피드백을 위해 문제에 매핑된 지식 구성 요소(KC)를 사용하는 지식 추적(KT) 모델을 제시합니다. 기존의 KC 생성 및 태깅 작업은 전문가의 수작업으로 매우 많은 노력이 필요했으나, 본 논문에서는 대규모 언어 모델(LLM) 기반의 완전 자동화된 파이프라인을 제시합니다. 이 파이프라인을 이용하여 생성된 KC와 LLM 기반 KT 프레임워크(KCGen-KT)를 실제 학생 코드 제출 데이터셋에 적용하여 기존 KT 방법 및 사람이 작성한 KC보다 향상된 성능을 보임을 실험적으로 증명합니다. 특히, 생성된 KC의 학습 곡선을 분석하여 인지 모델 하에서 사람이 작성한 KC보다 더 나은 적합성을 보이는 것을 확인하고, 강사를 대상으로 한 평가를 통해 생성된 문제-KC 매핑의 정확성을 검증합니다.

시사점, 한계점

시사점:
LLM을 활용하여 KC 생성 및 태깅 과정을 자동화함으로써, 온라인 학습 플랫폼에서 개인화된 학습 및 피드백 시스템 구축에 필요한 시간과 비용을 크게 절감할 수 있습니다.
LLM 기반 KCGen-KT는 기존 KT 방법 및 사람이 작성한 KC보다 학생의 미래 응답 예측 성능이 우수함을 보였습니다.
생성된 KC의 학습 곡선 분석을 통해 인지 모델의 적합성을 향상시킬 수 있음을 제시합니다.
강사 평가를 통해 생성된 문제-KC 매핑의 정확성을 검증했습니다.
한계점:
LLM 기반 KC 생성의 정확성 및 신뢰도에 대한 추가적인 연구가 필요합니다.
다양한 유형의 문제 및 학습 과제에 대한 일반화 가능성을 검증할 필요가 있습니다.
LLM의 편향성이나 오류가 KC 생성 및 KT 성능에 미치는 영향에 대한 분석이 부족합니다.
사용된 데이터셋의 특성에 따라 결과가 달라질 수 있으므로, 다양한 데이터셋에 대한 추가적인 실험이 필요합니다.
👍