Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Conversion de texte en SQL de bout en bout avec sélection d'ensembles de données : Exploiter les LLM pour la génération de requêtes adaptatives

Created by
  • Haebom

Auteur

Anurag Tripathi, Vaibhav Patle, Abhinav Jain, Ayush Pundir, Sairam Menon, Ajeet Kumar Singh, Dorien Herremans

Contour

Cet article propose un framework texte-vers-SQL complet en trois étapes qui identifie d'abord les bases de données correspondant à l'intention de requête d'un utilisateur dans un environnement de bases de données à grande échelle. Alors que les approches texte-vers-SQL existantes traduisent directement les requêtes en langage naturel en commandes SQL basées sur une base de données spécifique, notre framework exploite le LLM et l'ingénierie des prompts pour extraire un ensemble de règles des requêtes en langage naturel. À partir de ces règles, nous formons un modèle de prédiction db_id à grande échelle, intégrant un encodeur RoBERTa optimisé, pour prédire l'identifiant correct de la base de données (db_id). Enfin, nous utilisons un agent critique pour corriger les erreurs dans le SQL généré. Les résultats expérimentaux démontrent que le framework proposé surpasse les modèles de pointe en termes de prédiction de l'intention de la base de données et de précision de la génération SQL.

Takeaways, Limitations

Takeaways:
Fournit une solution efficace aux problèmes de conversion de texte en SQL dans les environnements contenant plusieurs bases de données.
Amélioration de la précision de l'identification des bases de données et de la génération SQL à l'aide de LLM et de Prompt Engineering
Amélioration de la précision des résultats de génération SQL grâce à l'agent de critique.
Répond au besoin de pré-spécification de la base de données dans le modèle texte-SQL existant, Limitations
Limitations:
Les performances du cadre proposé peuvent être affectées par les caractéristiques du LLM et de la base de données utilisés.
Des évaluations de performances de généralisation supplémentaires sont nécessaires pour différents types de bases de données et de requêtes complexes.
Manque de description détaillée du processus de conception et d’apprentissage de l’agent critique.
Des recherches supplémentaires sont nécessaires sur l’évolutivité et l’efficacité dans des environnements réels.
👍