Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

ST-Raptor : Question-réponse semi-structurée basée sur LLM

Created by
  • Haebom

Auteur

Zirui Tang, Boyu Niu, Xuanhe Zhou, Boxiu Li, Wei Zhou, Jiannan Wang, Guoliang Li, Xinyi Zhang, Fan Wu

Contour

Cet article propose ST-Raptor, un nouveau framework pour automatiser les réponses aux requêtes sur les tables semi-structurées, largement utilisé dans les applications réelles. Les tables semi-structurées présentent des dispositions complexes, telles que des en-têtes hiérarchiques et des cellules fusionnées, ce qui complique l'obtention de réponses précises aux requêtes avec les méthodes d'assurance qualité NL2SQL, NL2Code et LLM multimodales existantes. ST-Raptor utilise des arbres orthogonaux hiérarchiques (HO-trees) pour représenter les dispositions complexes et permet le traitement des requêtes LLM via des opérations arborescentes de base. Il décompose les requêtes utilisateur en sous-requêtes, génère un pipeline d'opérations arborescentes et effectue un alignement entre les opérations et les tables afin de garantir une exécution précise du pipeline. De plus, des validations ascendantes et descendantes sont utilisées pour améliorer la précision des résultats. Nous évaluons les performances de notre approche à l'aide d'un nouvel ensemble de données, SSTQA, composé de 102 tables semi-structurées réelles et de 764 questions, atteignant une précision jusqu'à 20 % supérieure à celle des méthodes existantes.

Takeaways, Limitations_

Takeaways:
Nous présentons une approche efficace du problème de réponse aux requêtes de table semi-structurées.
Nous proposons un cadre basé sur le modèle HO-Tree et des opérations d'arbre qui gèrent efficacement les dispositions de tables complexes.
Améliore la fiabilité des réponses grâce à un mécanisme de vérification en deux étapes.
Nous fournissons un nouvel ensemble de données de référence, SSTQA.
Il montre une précision jusqu’à 20 % supérieure à celle des méthodes existantes.
Limitations:
La taille de l’ensemble de données SSTQA peut être relativement petite.
Le modèle HO-Tree peut ne pas capturer parfaitement tous les types de dispositions de tableaux semi-structurés.
Cela dépend des performances de LLM, et les limitations de LLM peuvent affecter les performances de ST-Raptor.
Les performances de généralisation pour différents types de questions doivent être davantage validées.
👍