Sign In

A Multi-level Analysis of Factors Associated with Student Performance: A Machine Learning Approach to the SAEB Microdata

Created by
  • Haebom
Category
Empty

저자

Rodrigo Tertulino, Ricardo Almeida

개요

본 연구는 브라질의 기초 교육에서 학생 성적에 영향을 미치는 요인을 파악하기 위해, SAEB(기초 교육 평가 시스템)의 미세 데이터를 활용하여 9학년 및 고등학생의 숙련도를 분류하는 다층 머신 러닝 접근 방식을 제시합니다. 학생의 사회경제적 특성, 교사의 전문 프로필, 학교 지표, 교장 관리 프로필 등 4가지 데이터 소스를 통합했습니다. 앙상블 알고리즘의 비교 분석을 통해 Random Forest 모델의 우수성을 확인했으며, 90.2%의 정확도와 96.7%의 AUC를 달성했습니다. SHAP을 사용한 XAI를 통해 학교의 평균 사회경제적 수준이 가장 지배적인 예측 변수임을 밝혀냈으며, 개별 특성보다 시스템적 요인이 더 큰 영향을 미친다는 것을 입증했습니다.

시사점, 한계점

시사점:
학생 성적은 학교 생태계와 깊이 연관된 시스템적 현상임을 확인했습니다.
학교 간 격차 해소를 목표로 하는 교육 정책 수립에 기여할 수 있는 데이터 기반의 해석 가능한 도구를 제공합니다.
학교의 평균 사회경제적 수준이 학생 성적 예측에 가장 중요한 요소임을 밝혀냈습니다.
한계점:
구체적인 한계점에 대한 정보는 논문 요약에 명시되지 않았습니다.
👍