Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Texto a SQL de extremo a extremo con selección de conjuntos de datos: aprovechamiento de LLM para la generación de consultas adaptativas

Created by
  • Haebom

Autor

Anurag Tripathi, Vaibhav Patle, Abhinav Jain, Ayush Pundir, Sairam Menon, Ajeet Kumar Singh, Dorien Herremans

Describir

Este artículo propone un marco de conversión de texto a SQL de extremo a extremo en tres etapas que, en primer lugar, identifica las bases de datos que coinciden con la intención de consulta del usuario en un entorno de bases de datos a gran escala. Mientras que los enfoques de conversión de texto a SQL existentes traducen directamente las consultas en lenguaje natural a comandos SQL basados en una base de datos específica, nuestro marco aprovecha LLM y la ingeniería de indicaciones para extraer un conjunto de reglas de las consultas en lenguaje natural. Con base en estas reglas, entrenamos un modelo de predicción db_id a gran escala, que incorpora un codificador optimizado basado en RoBERTa, para predecir el identificador de base de datos correcto (db_id). Finalmente, utilizamos un agente de crítica para corregir errores en el SQL generado. Los resultados experimentales demuestran que el marco propuesto supera a los modelos más avanzados en cuanto a predicción de la intención de consulta y precisión en la generación de SQL.

Takeaways, Limitations

Takeaways:
Proporciona una solución eficaz a los problemas de conversión de texto a SQL en entornos que contienen múltiples bases de datos.
Mejora de la precisión de la identificación de bases de datos y la generación de SQL mediante LLM y Prompt Engineering
Mejorar la precisión de los resultados de generación de SQL a través del agente de crítica.
Aborda la necesidad de preespecificación de la base de datos en el modelo de texto a SQL existente, Limitations
Limitations:
El rendimiento del marco propuesto puede verse afectado por las características del LLM y la base de datos utilizada.
Se necesitan evaluaciones de rendimiento de generalización adicionales para varios tipos de bases de datos y consultas complejas.
Falta de descripción detallada del diseño y proceso de aprendizaje del agente de crítica.
Se necesita más investigación sobre escalabilidad y eficiencia en entornos del mundo real.
👍