Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ExCoT: Optimizing Reasoning for Text-to-SQL with Execution Feedback

Created by
  • Haebom
Category
Empty

저자

Bohan Zhai, Canwen Xu, Yuxiong He, Zhewei Yao

개요

본 논문은 대규모 언어 모델(LLM)을 이용한 Text-to-SQL 작업에서 Chain-of-Thought(CoT) 추론의 효과적인 활용 방안을 제시합니다. 기존의 zero-shot CoT 및 Direct Preference Optimization(DPO) 방식의 한계를 지적하고, CoT 추론과 off-policy 및 on-policy DPO를 결합한 새로운 프레임워크인 ExCoT를 제안합니다. ExCoT는 실행 정확도만을 피드백으로 사용하여 보상 모델이나 인간의 주석이 필요 없다는 장점이 있습니다. 실험 결과, ExCoT는 LLaMA-3 70B 및 Qwen-2.5-Coder 모델에서 BIRD 및 Spider 데이터셋의 실행 정확도를 크게 향상시켰으며, 단일 모델 기준으로 최첨단 성능을 달성했습니다.

시사점, 한계점

시사점:
CoT 추론과 DPO를 결합한 ExCoT 프레임워크는 Text-to-SQL 작업의 성능을 크게 향상시킬 수 있음을 보여줍니다.
실행 정확도만을 피드백으로 사용하여 효율적인 학습이 가능합니다.
단일 모델 기준으로 BIRD 및 Spider 데이터셋에서 최첨단 성능을 달성했습니다.
한계점:
제시된 ExCoT 프레임워크의 일반화 성능에 대한 추가적인 연구가 필요합니다.
다양한 데이터셋 및 LLM에 대한 실험 결과가 더 필요합니다.
보상 모델이나 인간의 주석 없이 실행 정확도만을 사용하는 접근 방식의 한계에 대한 추가적인 분석이 필요합니다.
👍