Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Analyse comparative de grands modèles linguistiques pour un accompagnement personnalisé dans l'apprentissage amélioré par l'IA

Created by
  • Haebom

Auteur

Bo Yuan, Jiazi Hu

Contour

Cet article compare expérimentalement la capacité de trois modèles linguistiques à grande échelle (MLH) de pointe – GPT-4o, DeepSeek-V3 et GLM-4.5 – à jouer un rôle de tutorat au sein d'environnements d'apprentissage personnalisés. À partir d'un ensemble de données de réponses d'étudiants composé de dix questions aux formats variés et aux libellés de bonnes réponses, chaque LH a été chargé (i) d'identifier les composantes de connaissances, (ii) d'inférer les profils de compréhension des apprenants et (iii) de générer des cartes d'amélioration orientées objectifs. Pour garantir l'objectivité, Gemini a été utilisé comme évaluateur virtuel pour effectuer des comparaisons par paires sur différentes dimensions, notamment l'exactitude, la clarté, la faisabilité et la pertinence, et analysées à l'aide du modèle Bradley-Terry.

Takeaways, Limitations

Takeaways:
Il a été démontré que le GPT-4o était plus adapté aux rôles de tutorat, générant des commentaires plus informatifs et bien structurés que les autres modèles.
Il offre la possibilité de déployer des LLM comme assistants pédagogiques avancés pour un accompagnement personnalisé de l'apprentissage.
Nous fournissons des conseils méthodologiques pour les futures recherches empiriques sur l’apprentissage personnalisé basé sur le LLM.
Limitations:
Il se peut que cela ne simule pas parfaitement un environnement d’apprentissage réel.
Il peut y avoir des limites quant à la taille et à la diversité de l’ensemble de données utilisé.
Un examen plus approfondi pourrait être nécessaire pour déterminer l’objectivité de l’utilisation de Gemini comme juge virtuel.
Des discussions plus approfondies pourraient être nécessaires concernant l’exhaustivité des paramètres d’évaluation (exactitude, clarté, faisabilité et pertinence).
👍