A Survey of NL2SQL with Large Language Models: Where are we, and where are we going?

작성자

Haebom

카테고리

Empty

저자

Xinyu Liu, Shuyu Shen, Boyan Li, Peixian Ma, Runzhi Jiang, Yuxin Zhang, Ju Fan, Guoliang Li, Nan Tang, Yuyu Luo

개요

본 논문은 대규모 언어 모델(LLM)을 활용한 NL2SQL(자연어 질의를 SQL 질의로 변환) 기술에 대한 종합적인 검토를 제공합니다. NL2SQL의 전 과정을 모델, 데이터, 평가, 오류 분석의 네 가지 측면에서 다루며, 각 측면에서 LLM 기반 NL2SQL의 기술 동향과 문제점을 분석합니다. 특히, 자연어의 모호성과 불완전한 명세 처리, 자연어와 데이터베이스 스키마 및 인스턴스 매핑 등의 어려움을 해결하는 다양한 기법들을 논의하고, 훈련 데이터 수집 및 합성, NL2SQL 벤치마크, 다양한 지표와 세분화된 수준의 평가 방법, 그리고 오류 분석을 통한 모델 개선 방향을 제시합니다. 아울러 NL2SQL 솔루션 개발을 위한 경험적 지침과 향후 연구 과제 및 미해결 문제를 논의합니다.