Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Evaluating undergraduate mathematics examinations in the era of generative AI: a curriculum-level case study

Created by
  • Haebom

저자

Benjamin J. Walker, Nikoleta Kalaydzhieva, Beatriz Navarro Lameda, Ruth A. Reynolds

개요

본 연구는 OpenAI의 ChatGPT와 같은 생성형 인공지능(GenAI) 도구의 등장이 전통적인 평가 방식에 미치는 영향을 조사한다. 특히, 대학교에서 비대면 시험을 고려하면서 학문적 정직성과 교육적 정렬에 대한 우려가 제기됨에 따라, GenAI 접근성을 허용한 비감독 환경에서 전통적인 폐쇄형 수학 시험이 교육적 관련성을 유지하는지 여부를 연구한다. 이를 위해 러셀 그룹 대학교의 1학년 전체 커리큘럼에 걸쳐 8개의 학부 수학 시험에 대한 GenAI의 답변을 생성, 기록, 블라인드 마킹하는 경험적 접근 방식을 사용했다. 모듈 수준과 1학년 전체 커리큘럼 수준에서 GenAI의 성능을 평가하여, GenAI의 성취도가 수석 학위 수준임을 발견했다.

시사점, 한계점

시사점:
GenAI의 수학 시험 성취도가 상당한 수준으로 나타났다.
비감독 환경에서 수학 평가 방식을 재설계할 필요가 있다.
생성형 인공지능 시대에 현재 평가 기준의 교육적 가치가 감소할 수 있다.
한계점:
구체적인 한계점은 논문 내용에 명시되어 있지 않음.
👍