Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Exploring the Application of Visual Question Answering (VQA) for Classroom Activity Monitoring

Created by
  • Haebom

저자

Sinh Trong Vu, Hieu Trung Pham, Dung Manh Nguyen, Hieu Minh Hoang, Nhu Hoang Le, Thu Ha Pham, Tai Tan Mai

개요

본 논문은 베트남 은행 아카데미의 실제 수업 영상을 기반으로 구축한 BAV-Classroom-VQA 데이터셋을 활용하여, LLaMA2, LLaMA3, QWEN3, NVILA 등 최신 오픈소스 Visual Question Answering (VQA) 모델의 수업 행동 분석 적용 가능성을 조사한 연구입니다. 다양한 VQA 모델의 성능을 벤치마킹하여 수업 행동 관련 시각적 질문에 대한 답변 정확도를 평가하고, 향후 수업 분석 및 개입 시스템에 대한 잠재력을 보여줍니다.

시사점, 한계점

시사점:
최신 VQA 모델이 수업 행동 분석에 효과적으로 적용될 수 있음을 보여줌.
BAV-Classroom-VQA 데이터셋을 통해 수업 행동 분석 연구를 위한 새로운 기준 마련.
향후 수업 분석 및 개입 시스템 개발에 기여할 잠재력 제시.
한계점:
연구에 사용된 데이터셋의 규모 및 다양성에 대한 제한.
특정 교육 환경(베트남 은행 아카데미)에 국한된 결과.
모델의 일반화 성능 및 다양한 수업 유형에 대한 적용 가능성에 대한 추가 연구 필요.
모델의 편향성 및 윤리적 고려 사항에 대한 추가 연구 필요.
👍