Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Preguntas de la tabla general: Respuesta mediante generación conjunta de fórmulas de respuesta

Created by
  • Haebom

Autor

Zhongyuan Wang, Richong Zhang, Zhijie Nie, Hangyu Mao

Describir

Este artículo destaca las limitaciones de los métodos existentes que utilizan diversos formatos de salida (p. ej., texto, consultas SQL, código Python) para resolver problemas complejos de inferencia en TableQA (Respuesta a Preguntas de Tabla) mediante Modelos de Lenguaje a Gran Escala (LLM). Para abordar las debilidades de los métodos existentes en tipos de preguntas o estructuras de tabla específicos, este artículo propone aprovechar las fórmulas de hojas de cálculo como representaciones ejecutables para TableQA. Para lograrlo, construimos FormulaQA, un conjunto de datos TableQA a gran escala con anotaciones de fórmulas basado en conjuntos de datos existentes, y proponemos TabAF, un marco general de TableQA que decodifica simultáneamente respuestas y fórmulas con una única estructura LLM. Los resultados experimentales demuestran que TabAF alcanza un rendimiento de vanguardia con el mismo tamaño de modelo en los conjuntos de datos WikiTableQuestion, HiTab y TabFact.

Takeaways, Limitations

Takeaways:
Un nuevo enfoque para aprovechar las fórmulas de las hojas de cálculo como representaciones ejecutables de TableQA.
Proponemos un marco TabAF que demuestra un excelente desempeño de generalización en una variedad de tipos de preguntas y estructuras de tablas.
Construcción de un conjunto de datos de anotación de fórmulas a gran escala llamado FormulaQA.
Lograr un rendimiento de última generación en múltiples conjuntos de datos
Limitations:
Existe la posibilidad de que el rendimiento del TabAF propuesto dependa en gran medida del tamaño del LLM (el experimento se realizó con el tamaño del modelo fijo en el artículo).
Se necesita una mayor validación de la versatilidad y diversidad del conjunto de datos de FormulaQA.
Se necesita más investigación sobre las limitaciones de rendimiento de TabAF para tipos específicos de problemas de inferencia complejos.
El uso de fórmulas de hojas de cálculo puede no ser adecuado para todos los tipos de problemas de TableQA.
👍