Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

FEAT : Un ensemble de données de rétroaction sur les préférences grâce à un cadre de génération et d'étiquetage automatique rentable pour le tutorat en anglais par IA

Created by
  • Haebom

Auteur

Hyein Seo, Taewook Hwang, Yohan Lee, Sangkeun Jung

Contour

Dans cet article, nous proposons FEAT, un cadre rentable pour générer du feedback pour les enseignants en enseignement de l'anglais. FEAT construit trois ensembles de données complémentaires : DIRECT-Manual (DM), qui exploite de manière collaborative les humains et les modèles linguistiques à grande échelle (LLM) pour générer des données de feedback pour les enseignants de haute qualité ; DIRECT-Generated (DG), qui utilise uniquement les LLM pour générer des données de manière rentable, mais de moindre qualité ; et DIRECT-Augmented (DA), qui ajoute une petite quantité de DM à DG pour améliorer la qualité tout en maintenant la rentabilité. Les résultats expérimentaux montrent que l'ajout d'une petite quantité de DM (5 à 10 %) à DG est plus performant que l'utilisation de DM à 100 %.

Takeaways, Limitations_

Takeaways:
Nous présentons un moyen rentable de générer des données de rétroaction des enseignants de haute qualité à l’aide de LLM.
Nous démontrons que de petites quantités de données de haute qualité peuvent être exploitées pour améliorer les performances sur des données de faible qualité.
Il fournit un cadre qui peut être utilisé pour développer des systèmes de tutorat basés sur l'IA dans d'autres domaines ainsi que dans l'enseignement de l'anglais.
Limitations:
Actuellement, son applicabilité peut être limitée car elle se limite au domaine de l’enseignement de l’anglais.
Cela dépend des performances du LLM, et les limitations du LLM peuvent affecter les performances du FEAT.
La réduction complète des coûts peut s’avérer difficile, car la création d’un ensemble de données DM entraîne toujours des coûts.
Des recherches supplémentaires sont nécessaires sur les performances de généralisation à travers différents types de rétroaction (par exemple, grammaire, vocabulaire, contenu, etc.).
👍