Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Exploration de l'application des questions-réponses visuelles (QV) pour le suivi des activités en classe

Created by
  • Haebom

Auteur

Sinh Trong Vu, Hieu Trung Pham, Dung Manh Nguyen, Hieu Minh Hoang, Nhu Hoang Le, Thu Ha Pham, Tai Tan Mai

Contour

Cet article examine l'applicabilité des modèles open source de questions-réponses visuelles (VQA) de pointe, tels que LLaMA2, LLaMA3, QWEN3 et NVILA, à l'analyse du comportement en classe à l'aide de l'ensemble de données BAV-Classroom-VQA, issu d'enregistrements vidéo de cours réels de la Vietnam Banking Academy. Cette étude présente la méthodologie de collecte et d'annotation des données et évalue les performances de certains modèles VQA, démontrant des performances prometteuses sur les questions visuelles comportementales, démontrant ainsi leur potentiel en tant que futurs systèmes d'analyse et d'intervention en classe.

Takeaways, Limitations

Takeaways:
Nous démontrons que les modèles VQA de pointe peuvent être appliqués efficacement à l’analyse du comportement en classe.
L'ensemble de données BAV-Classroom-VQA peut être une ressource précieuse pour la recherche sur l'analyse du comportement en classe.
Il peut contribuer au développement de futurs systèmes d’analyse et d’intervention en classe.
Limitations:
À Ce jour, seuls les premiers résultats expérimentaux ont été présentés et des expériences plus étendues et plus approfondies sont nécessaires.
Il peut y avoir des limites quant à la taille et à la diversité de l’ensemble de données.
Une attention supplémentaire est nécessaire pour diverses variables (éclairage, angle de caméra, etc.) qui peuvent entraver les performances du modèle.
Des vérifications et des compléments supplémentaires sont nécessaires pour une application dans des contextes éducatifs réels.
👍