Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

ÉDucation conversationnelle à grande échelle : un flux de travail multi-agents LLM pour l'apprentissage procédural et l'évaluation de la qualité pédagogique

Created by
  • Haebom

Auteur

Jiahuan Pei, Fanghua Ye, Xin Sun, Wentao Deng, Koen Hindriks, Junxiao Wang

Contour

Cet article propose un workflow multi-agents, WikiHowAgent, qui exploite des modèles linguistiques à grande échelle (MLH) pour simuler des conversations interactives d'enseignement-apprentissage. WikiHowAgent intègre des agents enseignants et apprenants, un gestionnaire d'interactions et un évaluateur pour faciliter l'apprentissage procédural et évaluer la qualité pédagogique. Nous présentons un ensemble de données de 114 296 conversations enseignants-apprenants couvrant 17 domaines et 727 sujets, basées sur 14 287 tutoriels. Nous utilisons un protocole d'évaluation combinant des mesures informatiques et basées sur des critères avec un alignement du jugement humain. Nous démontrons l'efficacité du workflow dans divers contextes et fournissons un aperçu des capacités des LMH dans différents domaines. L'ensemble de données et son implémentation sont entièrement open source.

Takeaways, Limitations_

Takeaways:
Une nouvelle approche pour développer des systèmes d’enseignement-apprentissage interactifs utilisant LLM.
Fournir des ensembles de données à grande échelle couvrant une variété de domaines et de sujets
Présentation d'un protocole d'évaluation objectif basé sur le calcul et le jugement humain.
Donner un aperçu du potentiel éducatif et des limites des LLM.
Augmenter la reproductibilité et l'évolutivité de la recherche grâce à l'open source
Limitations:
Une validation supplémentaire est nécessaire sur la généralisabilité des scénarios d’apprentissage basés sur les données de WikiHow.
Applicabilité limitée aux différents types de méthodes d'apprentissage et d'évaluation
Manque de prise en compte des préjugés et des questions éthiques du LLM
Manque d'analyse comparative avec les enseignants humains
Des recherches supplémentaires sont nécessaires sur l’application à des environnements éducatifs réels.
👍