Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Khám phá ứng dụng của Trả lời câu hỏi trực quan (VQA) để giám sát hoạt động lớp học

Created by
  • Haebom

Tác giả

Sinh Trọng Vũ, Hiếu Trung Phạm, Dũng Mạnh Nguyên, Hiếu Minh Hoàng, Như Hoàng Lê, Thu Hà Phạm, Tài Tấn Mai

Phác thảo

Bài báo này nghiên cứu khả năng ứng dụng các mô hình trả lời câu hỏi trực quan (VQA) nguồn mở tiên tiến, chẳng hạn như LLaMA2, LLaMA3, QWEN3 và NVILA, vào phân tích hành vi lớp học bằng cách sử dụng bộ dữ liệu BAV-Classroom-VQA, được lấy từ các video ghi hình lớp học thực tế của Học viện Ngân hàng Việt Nam. Nghiên cứu này trình bày phương pháp thu thập và chú thích dữ liệu, đồng thời đánh giá hiệu suất của một số mô hình VQA được lựa chọn, chứng minh hiệu suất đầy hứa hẹn đối với các câu hỏi trực quan về hành vi, từ đó chứng minh tiềm năng của chúng như một hệ thống phân tích và can thiệp trong lớp học trong tương lai.

Takeaways, Limitations

Takeaways:
Chúng tôi chứng minh rằng các mô hình VQA tiên tiến có thể được áp dụng hiệu quả vào việc phân tích hành vi trong lớp học.
Bộ dữ liệu BAV-Classroom-VQA có thể là nguồn tài nguyên có giá trị cho nghiên cứu phân tích hành vi trong lớp học.
Nó có thể đóng góp vào sự phát triển của các hệ thống phân tích và can thiệp trong tương lai.
Limitations:
Cho đến nay, chỉ có những kết quả thử nghiệm ban đầu được trình bày và cần có những thử nghiệm sâu rộng và toàn diện hơn.
Có thể có những hạn chế về quy mô và tính đa dạng của tập dữ liệu.
Cần cân nhắc thêm các biến số khác nhau (ánh sáng, góc máy ảnh, v.v.) có thể cản trở hiệu suất của mô hình.
Cần phải có sự xác minh và bổ sung thêm để có thể áp dụng vào môi trường giáo dục thực tế.
👍