Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

ST-Raptor: Preguntas y respuestas de tabla semiestructurada con tecnología LLM

Created by
  • Haebom

Autor

Zirui Tang, Boyu Niu, Xuanhe Zhou, Boxiu Li, Wei Zhou, Jiannan Wang, Guoliang Li, Xinyi Zhang, Fan Wu

Describir

Este artículo propone ST-Raptor, un novedoso framework para automatizar la respuesta a consultas de tablas semiestructuradas, ampliamente utilizado en aplicaciones del mundo real. Las tablas semiestructuradas presentan diseños complejos, como encabezados jerárquicos y celdas fusionadas, lo que dificulta la respuesta precisa a consultas utilizando los métodos existentes de control de calidad NL2SQL, NL2Code y LLM multimodal. ST-Raptor utiliza árboles ortogonales jerárquicos (HO-trees) para representar diseños complejos y permite el procesamiento de consultas LLM mediante operaciones básicas de árbol. Descompone las consultas del usuario en subconsultas, genera una secuencia de operaciones de árbol y realiza la alineación de la tabla de operaciones para garantizar la ejecución precisa de la secuencia. Además, se utiliza validación hacia adelante y hacia atrás para mejorar la precisión de los resultados. Evaluamos el rendimiento de nuestro enfoque utilizando un nuevo conjunto de datos, SSTQA, compuesto por 102 tablas semiestructuradas reales y 764 preguntas, logrando una precisión hasta un 20 % superior a la de los métodos existentes.

Takeaways, Limitations

Takeaways:
Presentamos un enfoque eficaz para el problema de respuesta a consultas de tablas semiestructuradas.
Proponemos un marco basado en el modelo HO-Tree y operaciones de árbol que manejan eficazmente diseños de tablas complejos.
Mejora la confiabilidad de las respuestas a través de un mecanismo de verificación de dos pasos.
Proporcionamos un nuevo conjunto de datos de referencia, SSTQA.
Muestra una precisión mejorada de hasta un 20% en comparación con los métodos existentes.
Limitations:
El tamaño del conjunto de datos SSTQA puede ser relativamente pequeño.
Es posible que el modelo HO-Tree no capture perfectamente todos los tipos de diseños de tablas semiestructuradas.
Depende del rendimiento de LLM, y las limitaciones de LLM pueden afectar el rendimiento de ST-Raptor.
Es necesario validar aún más el rendimiento de generalización para diferentes tipos de preguntas.
👍