Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

L'impact des défauts d'écriture des items sur la difficulté et la discrimination dans la théorie de la réponse aux items

Created by
  • Haebom

Auteur

Robin Schmucker, Steven Moore

Contour

Cet article souligne l'importance de développer des items de haute qualité dans les évaluations pédagogiques basées sur la théorie de la réponse aux items (IRT) et propose une méthode efficace de validation des items utilisant l'analyse des défauts d'écriture (IWF), remplaçant la méthode traditionnelle de pré-test, gourmande en ressources. Nous avons effectué une analyse IWF automatisée sur 7 126 items STEM à choix multiples selon 19 critères et analysé leurs corrélations avec les indices de difficulté et de discrimination IRT. Les résultats ont révélé des corrélations significatives entre le nombre d'IWF et les indices de difficulté et de discrimination IRT, notamment en sciences de la vie et de la terre et en sciences physiques. De plus, nous avons constaté que des critères IWF spécifiques (par exemple, l'utilisation d'un vocabulaire négatif par rapport à des options de réponses incorrectes irréalistes) avaient des effets variables sur la qualité et la difficulté des items. Ces résultats suggèrent que l'analyse IWF automatisée peut compléter les méthodes de validation existantes comme méthode efficace de présélection des items, notamment pour la sélection des items de faible difficulté. Cependant, nous soulignons également les limites des critères et algorithmes d'évaluation spécifiques à chaque domaine, ainsi que la nécessité de recherches complémentaires prenant en compte les caractéristiques spécifiques à chaque domaine.

Takeaways, Limitations_

Takeaways:
Présentation d'une méthode efficace de validation d'articles utilisant une analyse IWF automatisée.
Corrélation entre le nombre d'IWF et les indices de difficulté et de discrimination de l'IRT.
Analyse de l’impact de critères spécifiques de l’IWF sur la qualité et la difficulté des items.
Preuve de son utilité dans la sélection d’articles de faible difficulté.
Limitations:
Domaine Critères généraux d'évaluation et limites des algorithmes.
La nécessité de recherches supplémentaires prenant en compte la spécificité du domaine.
👍