본 논문은 대규모 데이터베이스에서 자연어 질문(NLQ)을 SQL 쿼리로 변환하는 Text-to-SQL 시스템의 정확도 향상을 위한 CRED-SQL 프레임워크를 제안합니다. 기존 Text-to-SQL 시스템은 대규모 데이터베이스에서 의미적으로 유사한 속성으로 인해 스키마 연결 및 의미 드리프트 문제로 정확도가 저하되는 어려움을 겪습니다. CRED-SQL은 클러스터 기반의 대규모 스키마 검색을 통해 NLQ와 관련된 테이블 및 컬럼을 정확하게 찾고, NLQ와 SQL 사이에 중간 표현 언어인 실행 설명 언어(EDL)를 도입하여 이러한 문제를 해결합니다. NLQ를 EDL로, EDL을 SQL로 변환하는 두 단계 과정을 통해 LLMs의 강력한 추론 능력을 활용하면서 의미 편차를 줄입니다. SpiderUnion과 BirdUnion 두 개의 대규모 크로스 도메인 벤치마크 실험 결과, CRED-SQL은 최첨단 성능을 달성함을 보여줍니다.
시사점, 한계점
•
시사점:
◦
대규모 데이터베이스에서 Text-to-SQL 시스템의 정확도를 향상시키는 새로운 방법 제시