본 논문은 Text-to-SQL 모델의 fine-tuning을 향상시키기 위해 Chain-of-Thought (CoT) rationale을 생성하는 프레임워크를 제시합니다. CoT rationale은 최종 SQL 쿼리를 생성하기 위한 중간 단계의 SQL 문과 설명으로 구성됩니다. 소량의 수동 주석 데이터를 사용하여 teacher model로부터 iterative, dynamic few-shot knowledge distillation을 통해 large language model을 prompt하고, 검증된 분해된 쿼리들을 사용하여 rationalization model을 학습시켜 Text-to-SQL 데이터셋에 대한 대량의 합성 CoT 주석을 생성합니다. BIRD 데이터셋을 사용하여 rationale 유무에 따른 small language model의 fine-tuning 결과를 비교 분석하여, 단계별 쿼리 생성이 특히 중간 및 고난이도 쿼리의 실행 정확도를 높이고 설명 가능성을 향상시킨다는 것을 보여줍니다.