Automatic database description generation for Text-to-SQL
Created by
Haebom
Category
Empty
저자
Yingqi Gao, Zhiling Luo
개요
본 논문은 Text-to-SQL 작업에서 명시적인 데이터베이스 설명이 없는 경우 효과적인 데이터베이스 설명을 자동으로 생성하는 방법을 제안합니다. 이 방법은 거칠게 세분화하는 과정과 세분화된 것을 다시 거칠게 하는 과정의 이중 과정을 사용합니다. 거칠게 세분화하는 과정은 LLM의 고유한 지식을 활용하여 데이터베이스에서 테이블, 열로 이해 과정을 안내하여 데이터베이스 구조에 대한 전체적인 이해와 문맥 정렬을 보장합니다. 반대로, 세분화된 것을 다시 거칠게 하는 과정은 열 수준에서 시작하여 테이블 수준으로 돌아갈 때 더 정확하고 미묘한 이해를 제공합니다. Bird 벤치마크에 대한 실험 결과에 따르면, 제안된 방법으로 생성된 설명을 사용하면 설명을 사용하지 않는 경우에 비해 SQL 생성 정확도가 0.93% 향상되고, 인간 수준 성능의 37%를 달성합니다. 소스 코드는 https://github.com/XGenerationLab/XiYan-DBDescGen 에서 공개적으로 이용 가능합니다.