Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

El impacto de los fallos en la redacción de ítems sobre la dificultad y la discriminación en la teoría de respuesta a los ítems

Created by
  • Haebom

Autor

Robin Schmucker, Steven Moore

Describir

Este artículo destaca la importancia de desarrollar ítems de alta calidad en evaluaciones educativas basadas en la Teoría de Respuesta al Ítem (TRI) y propone un método eficiente de validación de ítems mediante el análisis de Defectos de Escritura de Ítems (DIR), reemplazando el método tradicional de preevaluación, que consume muchos recursos. Realizamos un análisis automatizado de DIR en 7126 ítems STEM de opción múltiple basados en 19 criterios y analizamos sus correlaciones con los índices de dificultad y discriminación de la TRI. Los resultados revelaron correlaciones significativas entre el número de DIR y los índices de dificultad y discriminación de la TRI, particularmente en ciencias de la vida/tierra y ciencias físicas. Además, encontramos que criterios específicos de la TRI (p. ej., uso de vocabulario negativo vs. opciones de respuesta incorrecta poco realistas) tuvieron efectos variables en la calidad y dificultad de los ítems. Estos hallazgos sugieren que el análisis automatizado de DIR puede complementar los métodos de validación existentes como un método eficiente de preselección de ítems, particularmente para seleccionar ítems de baja dificultad. Sin embargo, también destacamos las limitaciones de los criterios y algoritmos de evaluación específicos del dominio, así como la necesidad de más investigaciones que consideren las características específicas del dominio.

Takeaways, Limitations

Takeaways:
Presentamos un método eficiente de validación de artículos mediante el análisis IWF automatizado.
Correlación entre el número de IWF y los índices de dificultad y discriminación del IRT.
Análisis del impacto de criterios específicos de la IWF en la calidad y dificultad de los ítems.
Prueba de su utilidad para seleccionar elementos de baja dificultad.
Limitations:
Dominio Criterios generales de evaluación y limitaciones de los algoritmos.
La necesidad de más investigaciones considerando la especificidad del dominio.
👍