Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

A Multi-level Analysis of Factors Associated with Student Performance: A Machine Learning Approach to the SAEB Microdata

Created by
  • Haebom
Category
Empty

저자

Rodrigo Tertulino, Ricardo Almeida

개요

본 연구는 브라질의 기초 교육에서 학생 성적에 영향을 미치는 요인을 파악하기 위해, SAEB(기초 교육 평가 시스템)의 마이크로 데이터를 활용하여 9학년 및 고등학생의 숙련도를 분류하는 다층 머신 러닝 접근 방식을 제시한다. 학생의 사회경제적 특성, 교사 프로필, 학교 지표, 교장 관리 프로필 등 4가지 데이터 소스를 통합한 Random Forest 모델을 사용했으며, 90.2%의 정확도와 96.7%의 AUC를 달성했다. XAI (SHAP)를 통해 분석한 결과, 학교의 평균 사회경제적 수준이 가장 중요한 예측 변수로 나타났으며, 이는 개인적 특성보다 시스템적 요인이 학업 성취도에 더 큰 영향을 미친다는 것을 시사한다. 본 연구는 학교 간 격차 해소를 위한 정책 수립에 기여할 수 있는 데이터 기반의 해석 가능한 도구를 제공한다.

시사점, 한계점

시사점:
학생의 학업 성취도가 학교의 생태계와 밀접하게 연관된 시스템적인 현상임을 확인했다.
학교 간 격차 해소를 위한 교육 정책 수립에 필요한 데이터 기반의 해석 가능한 도구를 제공한다.
Random Forest 모델을 사용하여 높은 정확도와 AUC를 달성했다.
XAI를 통해 모델의 예측 결과를 해석하고 주요 영향 요인을 파악했다.
한계점:
특정 지역 (브라질)의 데이터에 국한되어 일반화에 한계가 있을 수 있다.
모델의 성능은 데이터의 품질과 범위에 따라 달라질 수 있다.
추가적인 데이터 소스(예: 학생의 심리적 요인)를 고려하지 못했다.
👍