Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

El impacto de los fallos en la redacción de ítems sobre la dificultad y la discriminación en la teoría de respuesta a los ítems

Created by
  • Haebom

Autor

Robin Schmucker, Steven Moore

Describir

Este artículo presenta un estudio que utiliza una rúbrica de Defectos de Escritura de Ítems (IWF), que evalúa los ítems de la prueba con base en características textuales, para reemplazar el enfoque tradicional de validación de ítems basado en pruebas piloto, que consume muchos recursos, para evaluaciones educativas basadas en la teoría de respuesta al ítem (TRI). Aplicamos una rúbrica IWF automatizada (19 criterios) a 7126 preguntas de opción múltiple (STEM) y analizamos su relación con los parámetros de la TRI (dificultad, discriminación). El análisis reveló correlaciones significativas entre el número de IWF y los parámetros de dificultad y discriminación de la TRI, particularmente en ciencias de la vida/tierra y ciencias físicas, y reveló que criterios específicos de IWF (p. ej., vocabulario negativo, respuestas incorrectas poco realistas) tuvieron diversos grados de impacto en la calidad del ítem. En conclusión, sugerimos que el análisis automatizado de IWF puede ser un complemento eficiente a los métodos de validación existentes, particularmente útil para el cribado de preguntas de opción múltiple de baja dificultad.

Takeaways, Limitations

Takeaways:
El análisis IWF automatizado puede complementar de manera eficiente los métodos de validación de elementos IRT existentes que consumen muchos recursos.
El análisis IWF puede identificar eficazmente preguntas de opción múltiple de baja dificultad.
El análisis del impacto de criterios IWF específicos sobre la dificultad y la discriminación de los ítems se puede utilizar para mejorar el desarrollo de los ítems.
Limitations:
Este estudio se limitó al campo STEM y se necesita más investigación para determinar su generalización a otros campos.
Se necesita más investigación para mejorar los criterios y algoritmos de evaluación general del dominio.
Es necesario desarrollar algoritmos que comprendan el contenido específico del dominio.
👍