본 논문은 대규모 언어 모델(LLM) 기반 Text-to-SQL 시스템의 한계점(환각, 낙후된 지식, 추적 불가능한 추론)을 해결하기 위해 RAG(Retrieval-Augmented Generation)를 통합하는 연구에 대해 다룹니다. RAG는 테이블 스키마 및 메타데이터와 같은 맥락 정보를 제공하여 질의 생성 과정을 향상시키지만, 검색된 문서의 품질과 크기에 따라 성능이 크게 영향을 받습니다. 본 연구는 검색된 문서의 크기와 품질 간의 절충점을 찾고, 성능 저하가 발생하는 주요 임계값과 이를 완화하기 위한 전략을 제시하며, 환각 현상을 최소화하기 위한 문서 제시 방식의 중요성을 강조합니다. 궁극적으로 RAG + Text2SQL 시스템의 강건성을 높이는 로드맵을 제공하는 것을 목표로 합니다.