Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Más allá de la fragmentación: recuperación jerárquica consciente del discurso para responder preguntas sobre documentos extensos

Created by
  • Haebom

Autor

Huiyao Chen, Yi Yang, Yinghui Li, Meishan Zhang, Min Zhang

Describir

Este artículo presenta un marco jerárquico con enfoque discursivo que aprovecha la Teoría de la Estructura Retórica (TSR) para superar las limitaciones de los enfoques existentes, que no logran capturar las estructuras discursivas que facilitan la comprensión humana en sistemas de preguntas y respuestas de documentos extensos. Este marco transforma los árboles discursivos en representaciones a nivel de oración y conecta la información estructural y semántica mediante representaciones de nodos mejoradas por LLM. Sus innovaciones principales incluyen tres elementos clave: análisis sintáctico del discurso específico para documentos extensos, mejora de los nodos de relación discursiva basada en LLM y recuperación jerárquica basada en la estructura. Los experimentos con los conjuntos de datos QASPER, Quality y NarrativeQA demuestran mejoras consistentes en el rendimiento con respecto a los enfoques existentes, lo que demuestra que la integración de la estructura discursiva mejora significativamente el rendimiento de las preguntas y respuestas en una amplia gama de tipos de documentos.

Takeaways, Limitations

Takeaways:
Se presenta un enfoque novedoso para aprovechar la estructura del discurso en la formulación de preguntas y respuestas en documentos largos.
Combinando LLM y estructura del discurso para mejorar el rendimiento.
Se demostraron mejoras de rendimiento consistentes en diversos conjuntos de datos.
Realizar un estudio de eliminación para demostrar la importancia de la estructura del discurso.
Limitations:
El Limitations específico no se menciona explícitamente en el documento.
Costos computacionales y consumo potencial de recursos asociados con el uso de LLM.
Dependencia de la precisión y robustez del análisis del discurso basado en RST.
Limitado a una estructura discursiva específica (RST). Se debería considerar su extensión a otras teorías del discurso.
👍