Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

CRED-SQL: Mejora del análisis de texto a SQL de bases de datos a gran escala del mundo real mediante la recuperación y ejecución de clústeres Descripción

Created by
  • Haebom

Autor

Shaoming Duan, Zirui Wang, Chuanyi Liu, Zhibin Zhu, Yuhao Zhang, Peiyi Han, Liang Yan, Zewu Peng

Describir

Este artículo propone el marco CRED-SQL para mejorar la precisión de los sistemas de texto a SQL, que convierten consultas de lenguaje natural (NLQ) en consultas SQL en bases de datos de gran escala. Los sistemas de texto a SQL existentes presentan una precisión deficiente debido a errores de coincidencia de esquemas y a la deriva semántica causada por atributos semánticamente similares en bases de datos de gran tamaño. CRED-SQL resuelve este problema de discrepancia de esquemas identificando con precisión las tablas y columnas relacionadas con las NLQ mediante una búsqueda de esquemas a gran escala basada en clústeres. Además, al introducir el lenguaje de descripción de ejecución (EDL), un lenguaje de representación intermedio entre NLQ y SQL, CRED-SQL descompone la tarea en dos pasos: texto a EDL y EDL a SQL. Esta descomposición aprovecha las potentes capacidades de inferencia de los LLM y reduce la deriva semántica. Los resultados experimentales en dos pruebas de referencia interdominio a gran escala, SpiderUnion y BirdUnion, demuestran la eficacia y escalabilidad de CRED-SQL, logrando un rendimiento de vanguardia.

Takeaways, Limitations

Takeaways:
Proponemos un nuevo marco, CRED-SQL, que mejora significativamente la precisión de los sistemas de texto a SQL en bases de datos de gran escala.
Abordar problemas de desajuste de esquemas y deriva semántica mediante el descubrimiento de esquemas basado en clústeres y el lenguaje de representación intermedio EDL.
Conseguir un rendimiento de última generación en dos pruebas comparativas a gran escala.
Garantizar la reproducibilidad y extensibilidad mediante código abierto.
Limitations:
Se requiere mayor investigación para determinar el rendimiento de generalización del método propuesto. También es necesario verificar su dependencia de estructuras de base de datos o tipos de consulta específicos.
Se necesita más investigación para optimizar el diseño de EDL y mejorar la eficiencia del proceso de conversión de EDL a SQL.
Se necesitan más evaluaciones de rendimiento para bases de datos de diferente tamaño y complejidad.
👍