Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Explorando la aplicación de la respuesta visual a preguntas (VQA) para el monitoreo de actividades en el aula

Created by
  • Haebom

Autor

Sinh Trong Vu, Hieu Trung Pham, Dung Manh Nguyen, Hieu Minh Hoang, Nhu Hoang Le, Thu Ha Pham, Tai Tan Mai

Describir

Este artículo investiga la aplicabilidad de modelos de código abierto de vanguardia para preguntas visuales y respuestas (VQA), como LLaMA2, LLaMA3, QWEN3 y NVILA, al análisis del comportamiento en el aula utilizando el conjunto de datos BAV-Classroom-VQA, derivado de grabaciones de video de aulas reales de la Academia Bancaria de Vietnam. Este estudio presenta una metodología de recopilación y anotación de datos y evalúa el rendimiento de modelos VQA seleccionados, demostrando un rendimiento prometedor en preguntas visuales de comportamiento, lo que demuestra su potencial como futuros sistemas de análisis e intervención en el aula.

Takeaways, Limitations

Takeaways:
Demostramos que los modelos VQA de última generación se pueden aplicar eficazmente al análisis del comportamiento en el aula.
El conjunto de datos BAV-Classroom-VQA puede ser un recurso valioso para la investigación del análisis del comportamiento en el aula.
Puede contribuir al desarrollo de futuros sistemas de análisis e intervención de clases.
Limitations:
Hasta la fecha, sólo se han presentado resultados experimentales iniciales y se necesitan experimentos más amplios y profundos.
Puede haber limitaciones en el tamaño y la diversidad del conjunto de datos.
Es necesario tener en cuenta además varias variables (iluminación, ángulo de la cámara, etc.) que pueden dificultar el rendimiento del modelo.
Se necesitan verificaciones y complementos adicionales para su aplicación en entornos educativos reales.
👍