본 논문은 텍스트-SQL 모델 훈련 및 평가에 필수적인 데이터셋의 한계를 지적하고, 이를 해결하기 위해 새로운 분류 체계를 제안한다. 핵심 의도, 문장 유형, 구문 구조, 주요 동작을 포함하는 분류 체계를 사용하여 기존 데이터셋의 커버리지와 다양성을 평가하고, 이를 기반으로 대규모 언어 모델(LLM)을 활용한 새로운 데이터셋 생성 파이프라인(SQL-Synth)을 제시한다. SQL-Synth는 기존 벤치마크에 비해 더 큰 다양성과 커버리지를 보이며, LLM의 성능 향상 가능성을 보여준다.