AI 기술의 발전으로 교육 분야에서도 AI 활용이 급속도로 확대되고 있다. Google, Microsoft, OpenAI 등 대형 테크 기업들은 자사의 AI 모델을 교육에 최적화하기 위해 다양한 접근법을 시도하고 있다. 이 가운데 Google의 LearnLM, Microsoft와 Khan Academy의 Phi-3, OpenAI의 ChatGPT Edu가 최근 주목받고 있다. Google의 LearnLM은 동사의 Gemini 모델을 기반으로 교육에 특화된 대화형 튜터링 모델을 개발한 것이 특징이다. 연구진은 86페이지에 달하는 방대한 연구 논문을 통해 LearnLM의 개발 과정과 성과를 상세히 공개했다. 이들은 효과적인 교수법을 정의하고 측정하는 것이 쉽지 않다는 점을 인식하고, 능동적 학습 장려, 인지 부하 관리, 메타인지 심화, 동기부여와 호기심 자극, 학습자 맞춤형 적응 등 핵심적인 교수 전략을 파악했다. LearnLM은 단순한 프롬프팅이 아닌 파인튜닝을 통해 교육에 최적화된 모델로 진화했다. 연구진은 인간 튜터링 데이터, 생성형 AI 역할극 데이터, 수학 문제 대화 데이터, 교사들이 작성한 양질의 대화 데이터, 안전 데이터 등 다양한 데이터셋을 활용해 LearnLM을 단계적으로 파인튜닝했다. 이를 통해 LearnLM은 자연스러운 대화, 구조화되고 일관된 교수법, 단계별 문제 해결 설명, 고품질 교수 관행 등을 학습할 수 있었다. LearnLM의 성능은 정량적, 정성적, 자동화, 인간 평가 등 다각도로 평가되었다. 먼저 안전성과 편향성 측면에서 기존 벤치마크 테스트를 통과했으며, 인간 평가자들로부터 베이스 모델 대비 학습자 자신감 향상, 학생 참여 촉진, 능동적 학습 장려 등에서 높은 점수를 받았다. 자동화 평가에서도 LearnLM은 대부분의 교육적 태스크에서 베이스 모델을 능가하는 성능을 보여주었다. 그러나 LearnLM에는 한계점도 존재한다. 실제 교육 현장에서의 맥락 이해, 개인화된 지도, 비언어적 의사소통, 멀티모달 상호작용 등 인간 교사가 가진 장점을 온전히 구현하기에는 아직 부족한 면이 있다. 무엇보다 교육적 역량 향상이 실제 학습 성과로 직결되는지에 대해서는 추가적인 실증 연구가 필요해 보인다.