Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Rationalization Models for Text-to-SQL

Created by
  • Haebom
Category
Empty

저자

Gaetano Rossiello, Nhan Pham, Michael Glass, Junkyu Lee, Dharmashankar Subramanian

개요

본 논문은 Text-to-SQL 모델의 fine-tuning을 향상시키기 위해 Chain-of-Thought (CoT) rationale을 생성하는 프레임워크를 제시합니다. CoT rationale은 최종 SQL 쿼리를 생성하기 위한 중간 단계의 SQL 문과 설명으로 구성됩니다. 소량의 수동 주석 데이터를 사용하여 teacher model로부터 iterative, dynamic few-shot knowledge distillation을 통해 large language model을 prompt하고, 검증된 분해된 쿼리들을 사용하여 rationalization model을 학습시켜 Text-to-SQL 데이터셋에 대한 대량의 합성 CoT 주석을 생성합니다. BIRD 데이터셋을 사용하여 rationale 유무에 따른 small language model의 fine-tuning 결과를 비교 분석하여, 단계별 쿼리 생성이 특히 중간 및 고난이도 쿼리의 실행 정확도를 높이고 설명 가능성을 향상시킨다는 것을 보여줍니다.

시사점, 한계점

시사점:
Chain-of-Thought rationale을 활용하여 Text-to-SQL 모델의 성능 향상 및 설명 가능성 증대 가능성 제시
소량의 수동 주석 데이터를 활용한 효율적인 데이터 증강 방법 제시
중간 및 고난이도 쿼리에 대한 성능 향상 효과 확인
한계점:
제시된 프레임워크의 일반화 가능성에 대한 추가적인 연구 필요
teacher model의 성능에 대한 의존성 존재
다양한 Text-to-SQL 데이터셋 및 모델에 대한 추가적인 실험 필요
수동 주석 데이터의 질에 대한 의존성 존재
👍