Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Modelos de lenguaje amplios para la revisión bibliográfica automatizada: una evaluación de la generación de referencias, la redacción de resúmenes y la redacción de reseñas

Created by
  • Haebom

Autor

Xuemei Tang, Xufeng Duan, Zhenguang G. Cai

Describir

Este artículo explora el potencial y las limitaciones de automatizar las revisiones bibliográficas mediante modelos lingüísticos a gran escala (LLM). Si bien los LLM tienen el potencial de automatizar el proceso de revisión bibliográfica, incluyendo la recopilación, organización y resumen de documentos, su eficacia para automatizar revisiones bibliográficas exhaustivas y fiables sigue siendo incierta. Este estudio presenta un marco para evaluar automáticamente el rendimiento de los LLM en tres tareas fundamentales: generar referencias, resumir la literatura y redactar revisiones bibliográficas. Evaluamos la tasa de alucinación de las referencias generadas e introducimos una métrica de evaluación multidimensional que mide la cobertura semántica y la coherencia fáctica de los resúmenes y la redacción en comparación con los generados por humanos. Los resultados experimentales muestran que incluso los modelos más modernos, a pesar de los avances recientes, generan referencias alucinatorias. Además, demostramos que el rendimiento de los diferentes modelos en la redacción de revisiones bibliográficas varía entre disciplinas.

Takeaways, Limitations

Takeaways: Este artículo presenta un marco y métricas de evaluación para evaluar objetivamente el potencial y las limitaciones de la automatización de las revisiones bibliográficas mediante LLM. Al revelar que el rendimiento de LLM varía según las disciplinas académicas, este artículo sugiere la necesidad de desarrollar un modelo que considere las características específicas de cada campo.
Limitations: Incluso los LLM más recientes han identificado problemas al generar referencias a alucinaciones. Esto sugiere la necesidad de mayor investigación y desarrollo para mejorar la fiabilidad de la revisión bibliográfica automatizada mediante LLM. Se requiere mayor investigación para determinar la generalización del marco propuesto y las métricas de evaluación.
👍