Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Auto prompt SQL: una arquitectura que ahorra recursos para la traducción de texto a SQL en entornos restringidos

작성자
  • Haebom

Autor

Zetong Tang, Qian Ma, Di Wu

Describir

Este artículo presenta Auto Prompt SQL (AP-SQL), un modelo eficiente de conversión de texto a SQL para entornos con recursos limitados. AP-SQL realiza la transformación de texto a SQL combinando las ventajas de un modelo de código abierto a pequeña escala y eficiente en recursos con un potente modelo de código cerrado a gran escala. Consta de tres etapas: filtrado de esquemas, generación de conversión de texto a SQL con búsqueda basada en ejemplos de contexto y aumentada, y asociación de esquemas y generación de SQL basada en indicaciones. Para mejorar la precisión en la selección de esquemas, perfeccionamos un modelo de lenguaje a gran escala y mejoramos su capacidad de inferencia mediante ingeniería de indicaciones utilizando plantillas de Cadena de Pensamiento (CoT) y Gráfico de Pensamiento (GoT). Una evaluación exhaustiva realizada con el benchmark Spider demuestra la eficacia de AP-SQL.

Takeaways, Limitations

Takeaways:
Presentando la posibilidad de construir un modelo de texto a SQL efectivo incluso en entornos con recursos limitados.
Una nueva propuesta de arquitectura que combina las ventajas de los modelos de código abierto de pequeña escala y los modelos de gran escala.
Mejora del rendimiento mediante técnicas de ingeniería rápida (CoT, GoT)
Demostrado su eficacia en el benchmark Spider
Limitations:
Se necesita más investigación para determinar la generalización de la metodología presentada en este documento.
Se necesitan evaluaciones de desempeño adicionales en diversos conjuntos de datos.
Falta de descripción detallada de los tipos y especificaciones específicos de los modelos de lenguaje a gran escala utilizados.
Se requiere una mayor verificación del rendimiento y la escalabilidad en entornos de aplicaciones del mundo real.
👍