Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Educación conversacional a escala: un flujo de trabajo multi-LLM para el aprendizaje procedimental y la evaluación de la calidad pedagógica

Created by
  • Haebom

Autor

Jiahuan Pei, Fanghua Ye, Xin Sun, Wentao Deng, Koen Hindriks, Junxiao Wang

Describir

Este artículo propone un flujo de trabajo multiagente, WikiHowAgent, que aprovecha modelos lingüísticos a gran escala (LLM) para simular conversaciones interactivas de enseñanza-aprendizaje. WikiHowAgent integra agentes docentes y de aprendizaje, un gestor de interacciones y un evaluador para facilitar el aprendizaje procedimental y evaluar la calidad educativa. Presentamos un conjunto de datos de 114.296 conversaciones docente-alumno que abarcan 17 dominios y 727 temas, basados ​​en 14.287 tutoriales. Utilizamos un protocolo de evaluación que combina métricas computacionales y basadas en criterios con la alineación del juicio humano. Demostramos la eficacia del flujo de trabajo en diversos entornos y proporcionamos información sobre las capacidades de los LLM en diferentes dominios. El conjunto de datos y la implementación son completamente de código abierto.

Takeaways, Limitations

Takeaways:
Un nuevo enfoque para el desarrollo de sistemas interactivos de enseñanza-aprendizaje utilizando LLM.
Proporcionar conjuntos de datos a gran escala que cubran una variedad de dominios y temas
Presentando un protocolo de evaluación objetivo basado en el cálculo y el juicio humano.
Proporcionar información sobre el potencial educativo y las limitaciones de los LLM.
Aumentar la reproducibilidad y escalabilidad de la investigación mediante código abierto
Limitations:
Se necesita una mayor validación de la generalización de los escenarios de aprendizaje basados ​​en los datos de WikiHow.
Aplicabilidad limitada a diferentes tipos de métodos de aprendizaje y evaluación.
Falta de consideración de los sesgos y cuestiones éticas del LLM
Falta de análisis comparativo con docentes humanos
Se necesita más investigación sobre su aplicación en entornos educativos del mundo real.
👍