Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Réponse aux questions du tableau général via la génération conjointe de formules de réponse

Created by
  • Haebom

Auteur

Zhongyuan Wang, Richong Zhang, Zhijie Nie, Hangyu Mao

Contour

Cet article met en évidence les limites des méthodes existantes utilisant divers formats de sortie (par exemple, texte, requêtes SQL, code Python) pour résoudre des problèmes d'inférence complexes dans TableQA (Table Question Answering) à l'aide de modèles de langage à grande échelle (LLM). Afin de remédier aux faiblesses des méthodes existantes pour des types de questions ou des structures de tableaux spécifiques, cet article propose d'exploiter des formules de tableur comme représentations exécutables pour TableQA. Pour y parvenir, nous construisons FormulaQA, un jeu de données TableQA à grande échelle annoté par des formules, basé sur des jeux de données existants, et proposons TabAF, un framework TableQA général qui décode simultanément les réponses et les formules avec une seule structure LLM. Les résultats expérimentaux démontrent que TabAF atteint des performances de pointe avec la même taille de modèle sur les jeux de données WikiTableQuestion, HiTab et TabFact.

Takeaways, Limitations

Takeaways:
Une nouvelle approche pour exploiter les formules de feuille de calcul comme représentations exécutables de TableQA.
Nous proposons un cadre TabAF qui démontre d’excellentes performances de généralisation sur une variété de types de questions et de structures de tableaux.
Création d'un ensemble de données d'annotation de formules à grande échelle appelé FormulaQA.
Atteindre des performances de pointe sur plusieurs ensembles de données
Limitations:
Il est possible que les performances du TabAF proposé dépendent fortement de la taille du LLM (l'expérience a été menée avec la taille du modèle fixée dans l'article).
Une validation supplémentaire de la polyvalence et de la diversité de l’ensemble de données FormulaQA est nécessaire.
Des recherches supplémentaires sont nécessaires sur les limitations de performances de TabAF pour des types spécifiques de problèmes d’inférence complexes.
L’utilisation de formules de feuille de calcul peut ne pas convenir à tous les types de problèmes TableQA.
👍