Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Invite automatique SQL : une architecture économe en ressources pour la traduction de texte en SQL dans des environnements contraints

Created by
  • Haebom

Auteur

Zetong Tang, Qian Ma, Di Wu

Contour

Cet article présente Auto Prompt SQL (AP-SQL), un modèle texte-SQL performant pour les environnements à ressources limitées. AP-SQL réalise la conversion texte-SQL en combinant les atouts d'un modèle open source à petite échelle et économe en ressources avec un modèle fermé à grande échelle et puissant. Il se compose de trois étapes : filtrage des schémas, génération texte-SQL enrichie par une recherche basée sur des exemples contextuels, et association de schémas et génération SQL basée sur des invites. Pour améliorer la précision de la sélection des schémas, nous affinons un modèle de langage à grande échelle et améliorons ses capacités d'inférence grâce à l'ingénierie des invites utilisant des modèles de chaîne de pensée (CoT) et de graphique de pensée (GoT). Une évaluation complète à l'aide du benchmark Spider démontre l'efficacité d'AP-SQL.

Takeaways, Limitations_

Takeaways:
Présenter la possibilité de construire un modèle Text-to-SQL efficace même dans des environnements aux ressources limitées.
Une nouvelle proposition d’architecture qui combine les avantages des modèles open source à petite échelle et des modèles à grande échelle.
Amélioration des performances grâce à des techniques d'ingénierie rapide (CoT, GoT)
Efficacité prouvée dans le benchmark Spider
Limitations:
Des recherches supplémentaires sont nécessaires pour déterminer la généralisabilité de la méthodologie présentée dans cet article.
Des évaluations de performance supplémentaires sur divers ensembles de données sont nécessaires.
Manque de description détaillée des types et spécifications spécifiques des modèles linguistiques à grande échelle utilisés.
Une vérification supplémentaire des performances et de l’évolutivité dans des environnements d’application réels est nécessaire.
👍