Share
Sign In
AI를 성적 평가에 사용하는 것에 대한 고민
콘텐주
1.
이해와 정성적 판단 능력 부족
GenAI는 훈련 데이터 패턴에 기반한 확률적 출력을 생성하며, 진정한 이해와 판단 능력이 부족함.
2.
성적 평가의 불일치와 편향
동일한 과제에 대해 점수가 크게 달라질 수 있어 공정성과 신뢰성이 훼손됨.
3.
사회적 편견과 차별 가능성
훈련 데이터에 포함된 편견이 모델에 반영되어 특정 그룹에 불이익을 줄 수 있음.
4.
형평성 격차 악화
AI 도구 접근성의 차이로 인해 성취도 격차가 커질 수 있음.
5.
교육 기관 간의 접근성 차이
더 강력한 모델을 사용할 수 있는 기관과 그렇지 않은 기관 간의 격차가 발생할 수 있음.
6.
진정한 이해 부족
AI는 훈련 데이터의 패턴에 기반한 출력만을 생성, 진정한 이해 없이 평가함.
7.
공정성, 책임성, 투명성 문제
AI 생성 성적의 객관성 외관이 격차를 가리고 공평한 평가를 방해할 수 있음.
8.
인간과 인공지능의 차이
AI는 인간 교육자의 판단과 전문성을 대체할 수 없으며, 이를 보조하는 데 집중해야 함.
9.
평가 방식 재고
성적 부여의 목적과 방법을 재고할 필요가 있으며, 학생들이 학습을 입증할 수 있는 다양한 방법을 모색해야 함.
생성형 AI(GenAI)는 평가 및 보고의 업무량을 줄일 수 있다는 점에서 매력적으로 보일 수 있습니다. 과거 중등 영어 교사, 고위 시험 평가자, 초기 교사 교육 강사로서 저는 GenAI를 사용하여 학생 작업을 채점하는 것의 매력을 이해합니다. 하지만 이 기술은 고부담 학생 평가에 근본적으로 부적합하다고 확신합니다.
GenAI는 기본적으로 훈련 데이터의 패턴에 기반한 확률적 출력을 생성하며, 진정한 이해와 정성적 판단 능력이 부족합니다. 이는 성적 평가의 불일치와 편향으로 이어져 공정성과 신뢰성에 대한 심각한 우려를 제기합니다. 동일한 9학년 설득 글쓰기 과제를 여러 번 ChatGPT에 입력했을 때, 학생 이름만 바꾸면 점수가 78점에서 95점까지 크게 달라졌습니다. 이러한 불일치는 성적 평가 과정의 공정성과 신뢰성을 완전히 훼손합니다.
더욱 우려되는 점은 GenAI 모델이 인터넷에서 수집한 방대한 데이터 세트를 기반으로 훈련되어 사회적 편견과 차별을 포함할 수 있다는 것입니다. 이 모델은 학생의 글쓰기를 기반으로 인종, 성별, 배경과 같은 학생의 속성을 추론하여 특정 그룹에 불이익을 줄 수 있습니다. 이러한 편견은 인간 채점자의 편견과 비교할 때 발견하고 해결하기가 훨씬 더 어렵습니다. 우리는 익명화와 중재와 같은 전략을 가지고 있지만, AI의 경우 단순히 학생의 이름을 제거하는 것만으로는 충분하지 않습니다. 편견은 훈련 데이터와 모델이 습득한 패턴을 기반으로 모델에 훨씬 더 깊은 수준으로 내재되어 있습니다.
AI를 성적 평가에 사용하는 것은 교육에서 기존의 형평성 격차를 악화시킬 가능성이 있습니다. AI 도구에 대한 접근성은 결코 평등하지 않습니다. 저소득층 가정의 학생은 기본적인 무료 AI 도구에 의존하는 반면, 부유한 배경의 학생은 GPT-4와 같은 고급 모델에 대한 구독료를 지불할 여유가 있습니다. 더 나은 AI 도구에 접근할 수 있는 학생은 높은 품질의 작업을 생성하고, 반복하고 개선할 수 있으며, 탐지 도구와 같은 것들을 활용할 때 시스템을 잠재적으로 이용할 수 있습니다. 시간이 지남에 따라 이는 성취도 격차를 악화시키고 특권을 강화할 수 있습니다.
학교, 대학, 교육자가 서로 다른 수준의 GenAI에 접근할 수 있다는 점도 고려해야 합니다. GPT-3.5와 비교하여 GPT-4로 평가되는 학생에게 어떤 일이 일어날지 생각해 보십시오. 지금까지 AI의 "편향 해소" 노력은 어느 정도 성공적이었을 뿐이며, 더 강력한 모델에 대해서만 성공적이었습니다. 예를 들어 GPT-4는 완벽하지는 않지만 GPT-3.5보다 편향이 적습니다. 따라서 더 강력한 모델을 사용할 수 있는 재정적, 기술적 자원을 가진 교육자나 기관은 더 정교하고 잠재적으로 편향이 적은 피드백을 제공할 것입니다.
근본적으로 언어 모델(LLM)을 사용하여 학생 작업을 평가하는 것은 프롬프트나 입력이 아무리 정교하더라도 문제가 있습니다. LLM은 진정한 추론이나 이해 능력 없이 훈련 데이터의 패턴에 기반한 확률적 출력을 생성합니다. 이는 입력에 세부적인 루브릭, 특정 채점 기준 또는 평가된 의견이 있는 샘플 학생 작업이 포함되어 있더라도 마찬가지입니다. 이러한 추가적인 맥락 요소는 LLM의 응답을 고정하고 더 설득력 있게 만드는 데 도움이 될 수 있지만, 궁극적으로 출력은 진정한 이해보다는 통계적 추론의 산물로 남아 있습니다.
AI의 고부담 평가 사용은 또한 공정성, 책임성, 투명성에 대한 우려를 제기합니다. 인간 채점자는 편견을 나타낼 수 있지만, 이를 인식하고 완화하도록 훈련할 수 있습니다. 반면에 LLM의 편견은 훈련 데이터와 아키텍처에 내재되어 있으며, 식별하고 해결하기가 더 어려울 수 있습니다. AI 생성 성적의 객관성 외관은 근본적인 격차를 가리고 공평한 평가를 보장하기 위한 노력을 방해할 수 있습니다.
학생 작업을 평가하기 위해 LLM을 사용하는 것은 인간과 인공지능의 근본적인 차이를 인식하지 못하는 기술의 오용입니다. 평가 과정을 자동화하려고 하기보다는 인간 교육자의 능력을 지원하고 향상시키는 데 AI를 활용하는 데 초점을 맞추어야 하며, 동시에 학생 학습 평가에서 인간의 판단과 전문성의 필수적인 역할을 보존해야 합니다.
우리는 애초에 왜 성적을 매기는지에 대해 의문을 제기하는 것부터 시작해야 합니다. 평가와 성적 부여는 단순히 경쟁, 순위 매기기, 배치의 문제입니까? 아니면 TEQSA가 최근 평가에서 AI 도구 사용과 관련하여 질문했듯이, 학생들이 학습을 입증할 수 있는 다른 방법과 교육자들이 학생들의 학습 여부를 평가할 수 있는 다른 방법이 있습니까?
적어도 생성형 AI는 우리에게 이러한 어렵고 때로는 불편한 대화를 하도록 강요하고 있습니다.
#ChatGPT #학생평가 #AI편향 #교육격차 #평가방식재고
/learntoday
Subscribe
LearningApps.org: 인터랙티브하고 멀티미디어 학습 도구
LearningApps.org는 학생들과 교육자들이 교육 과정을 더욱 흥미롭게 만들 수 있도록 도와주는 온라인 플랫폼입니다. 이 플랫폼은 다양한 인터랙티브 학습 도구와 멀티미디어 학습 자료를 제공합니다. 주요 기능 앱 탐색 LearningApps.org에서는 여러 주제에 걸쳐 다양한 학습 앱을 탐색할 수 있습니다. 사용자는 이미 만들어진 앱을 검색하고, 자신에게 맞는 학습 자료를 쉽게 찾을 수 있습니다. 앱 만들기 사용자는 자신만의 학습 앱을 만들 수 있습니다. 이 기능을 통해 교사들은 학생들에게 맞춤형 학습 자료를 제공할 수 있으며, 학생들도 직접 참여하여 학습 효과를 높일 수 있습니다. 컬렉션 만들기 여러 개의 앱을 모아 하나의 컬렉션으로 만들 수 있는 기능도 제공됩니다. 이 기능은 특정 주제에 대한 학습 자료를 체계적으로 정리하고 공유하는 데 유용합니다. 멀티언어 지원 LearningApps.org는 다양한 언어를 지원합니다. 사용자는 자신이 편한 언어를 선택하여 서비스를 이용할 수 있습니다. 지원되는 언어에는 독일어, 영어, 스페인어, 프랑스어, 이탈리아어 등이 포함됩니다. 사용 방법 로그인 및 회원가입 플랫폼의 모든 기능을 사용하기 위해서는 회원가입이 필요합니다. 가입 후 로그인을 통해 자신의 학습 진행 상황을 저장하고, 자신만의 학습 앱을 만들 수 있습니다. 기부 및 지원 LearningApps.org는 사용자들의 기부를 통해 운영됩니다. 기부금은 플랫폼의 지속적인 발전과 원활한 운영에 사용되며, 더 나은 학습 환경을 제공하는 데 기여합니다. 결론 LearningApps.org는 현대 교육 환경에서 매우 유용한 도구입니다. 다양한 학습 자료와 사용자 친화적인 인터페이스를 통해 학생들과 교사들은 쉽게 접근하고 사용할 수 있습니다. 더 많은 사람들이 이 플랫폼을 이용하여 교육의 질을 높이고, 학습의 즐거움을 느끼기를 기대합니다.
콘텐주
AI 도구 도입에 따른 K-12 교육 격차 확대 우려와 긍정적 측면
격차 확대의 우려 디지털 접근성 문제: 가정에서 인터넷이나 개인 기기를 사용할 수 없는 학생들이 불리해질 가능성. 예시: 캘리포니아 저소득 가정 학생들 중 40%가 학교 외부에서 인터넷에 접근하지 못함[5]. 기술 격차: AI 도구 사용은 더 많은 자원을 가진 학교와 학생들에게 유리. 연구에 따르면 첫 세대 대학생들 중 ChatGPT에 대한 인식이 낮아 기술 격차가 심화될 수 있음[3]. 긍정적 측면과 해결 방안 교육적 도구로서의 가능성: AI 도구는 작문 과제에서 작가의 블록을 극복하는 데 도움을 줄 수 있음. AI 윤리 관련 교실 토론을 촉진 가능[2]. 디지털 평등 노력: 연방 인프라 자금이 저소득 가정에 고속 인터넷 서비스 보조에 사용됨[5]. AI 도구의 공정성을 높이기 위한 연구와 개발도 진행 중. 교사와 학생의 인식 교사의 회의적 시각: Pew Research Center 조사에 따르면, 많은 교사들이 AI 도구 사용에 대해 회의적이거나 불확실한 입장을 보임. 25%의 교사는 AI 도구가 K-12 교육에 더 많은 해를 끼칠 것이라 생각하며, 32%는 이점과 해로움이 비슷하다고 응답[4]. 학생들의 사용 현황: 13세에서 17세 사이 청소년 중 2/3가 ChatGPT를 알고 있으며, 이 중 19%는 학교 과제를 돕기 위해 사용한 적이 있음[4].
콘텐주
에듀테크에서 익명 참여의 영향: 장점과 과제
최근 에듀테크에서 익명 참여가 점점 중요해지고 있습니다. 학생들의 참여와 학습 성과에 미치는 영향을 중심으로 익명 참여의 장점과 단점, 그리고 이를 효과적으로 활용하는 방법에 대해 살펴보겠습니다. 익명 참여의 장점 참여율 증가: 익명성이 보장되면 학생들은 온라인 토론 게시판에서 더 활발하게 참여합니다. 이는 자기 표현에 대한 두려움이 줄어들기 때문입니다. 익명으로 질문하거나 의견을 나누는 것이 더 편하기 때문에 많은 학생들이 더 적극적으로 참여합니다. 또한 전자 응답 시스템(ERS)을 활용한 수업 활동에서도 익명이 보장될 때 전통적인 손들기 방식보다 참여도가 높습니다. 익명성은 학생들이 다른 사람들의 평가를 두려워하지 않고 참여할 수 있게 해줍니다. 참여도 향상: 익명 모바일 토론 플랫폼은 특히 큰 그룹에서 학생들 간의 소통과 참여를 촉진합니다. 익명성을 통해 학생들은 자신의 신원을 공개하지 않고 질문을 하거나 상호작용할 수 있어, 학습 내용에 대한 깊은 참여를 유도합니다. 익명 참여의 단점 참여의 질 저하: 익명성은 참여의 양을 늘릴 수 있지만, 기여의 질에는 부정적인 영향을 미칠 수 있습니다. 익명 환경에서는 주제와 상관없는 행동이나 스팸이 늘어나고, 생산적이지 않은 분위기가 조성될 수 있습니다. 또한 익명 게시물에는 책임감이 부족할 수 있어, 다른 사람을 비방하거나 해로운 댓글을 다는 등 바람직하지 않은 행동이 발생할 수 있습니다. 신뢰성 인식 문제: 익명 게시물과 실명 게시물 간에 신뢰성 인식에는 큰 차이가 없지만, 학생들은 작성자를 알거나 게시물이 흥미롭거나 동의하지 않을 때 더 많이 반응하는 경향이 있습니다. 교육자를 위한 권장 사항 익명성과 실명의 균형 맞추기: 교육자들은 학생 참여를 높이기 위해 익명 게시물을 허용하되, 학생들의 자기 효능감과 책임 있는 온라인 행동을 향상시키기 위한 교육을 함께 제공해야 합니다. 좋은 습관과 적절한 네티켓을 장려하는 활동을 도입하면, 익명의 장점을 유지하면서 단점을 줄이는 데 도움이 됩니다. 기술 활용: 전자 응답 시스템과 익명 모바일 토론 플랫폼은 큰 그룹 수업에서 유용할 수 있습니다. 이러한 도구들은 모든 학생이 편안하게 참여할 수 있는 포용적인 환경을 조성하는 데 도움을 줍니다. 익명 참여의 장점과 단점을 이해하고 이를 효과적으로 활용하는 방법을 찾는 것이 중요합니다. #에듀테크 #익명참여 #교육기술 #학생참여 #온라인학습 #교육혁신 #익명성 #학습효과 #온라인교육 #네티켓
콘텐주