Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

FEAT: Un conjunto de datos de retroalimentación de preferencias mediante un marco rentable de generación automática y etiquetado para la tutoría de inglés con IA

Created by
  • Haebom

Autor

Hyein Seo, Taewook Hwang, Yohan Lee, Sangkeun Jung

Describir

En este artículo, proponemos FEAT, un marco rentable para generar retroalimentación docente en la enseñanza del inglés. FEAT construye tres conjuntos de datos complementarios: DIRECT-Manual (DM), que aprovecha de forma colaborativa la participación de personas y modelos lingüísticos a gran escala (LLM) para generar datos de retroalimentación docente de alta calidad; DIRECT-Generated (DG), que utiliza únicamente LLM para generar datos de forma rentable, pero con menor calidad; y DIRECT-Augmented (DA), que añade una pequeña cantidad de DM a los DG para aumentar la calidad manteniendo la rentabilidad. Los resultados experimentales muestran que añadir una pequeña cantidad de DM (5-10%) a los DG supera el rendimiento de usar solo el 100% de DM.

Takeaways, Limitations

Takeaways:
Presentamos una forma rentable de generar datos de retroalimentación docente de alta calidad utilizando LLM.
Demostramos que se pueden aprovechar pequeñas cantidades de datos de alta calidad para mejorar el rendimiento con datos de baja calidad.
Proporciona un marco que se puede utilizar para desarrollar sistemas de tutoría basados ​​en IA en otros campos, así como en la enseñanza del inglés.
Limitations:
Actualmente, su aplicabilidad puede ser limitada ya que se limita al campo de la educación del inglés.
Depende del rendimiento de LLM, y las limitaciones de LLM pueden afectar el rendimiento de FEAT.
La reducción total de costos puede resultar difícil, ya que la creación de conjuntos de datos DM aún genera costos.
Se necesita más investigación sobre el desempeño de la generalización en diferentes tipos de retroalimentación (por ejemplo, gramática, vocabulario, contenido, etc.).
👍