Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Continual Learning of Domain Knowledge from Human Feedback in Text-to-SQL

Created by
  • Haebom
Category
Empty

저자

Thomas Cook, Kelly Patel, Sivapriya Vellaichamy, Udari Madhushani Sehwag, Saba Rahimi, Zhen Zeng, Sumitra Ganesh

개요

본 논문은 대형 언어 모델(LLM)이 자연어 질문으로부터 SQL 쿼리를 생성하는 과정에서 데이터베이스 관련 스키마와 암묵적인 도메인 지식에 어려움을 겪는 문제를 해결하기 위한 프레임워크를 제시한다. 이 프레임워크는 텍스트-to-SQL에서 인간 피드백으로부터 지속적으로 학습하는 방식을 채택하며, 학습 에이전트가 자연어 피드백을 받아 쿼리를 개선하고, 드러난 지식을 미래의 작업에 재사용할 수 있도록 한다. 특히, 이러한 증류된 지식은 구조화된 메모리에 저장되어 에이전트가 시간이 지남에 따라 실행 정확도를 향상시킬 수 있도록 한다. 다양한 학습 에이전트 아키텍처를 설계 및 평가하여 과거 경험을 포착하고 검색하는 방식을 비교했으며, BIRD 벤치마크 Dev set에 대한 실험 결과, 메모리 보강 에이전트, 특히 Procedural Agent가 인간-in-the-loop 피드백을 활용하여 상당한 정확도 향상과 오류 감소를 달성했음을 보여준다.

시사점, 한계점

시사점:
인간 피드백을 통해 텍스트-to-SQL 시스템의 성능을 지속적으로 향상시킬 수 있는 프레임워크 제시.
암묵적인 인간 전문 지식을 재사용 가능한 지식으로 변환하는 방법론 제시.
메모리 보강 에이전트가 실행 정확도 향상에 효과적임을 입증.
Procedural Agent의 높은 성능을 통해, 인간-in-the-loop 학습의 효율성을 강조.
한계점:
BIRD 벤치마크 Dev set에서의 실험 결과만 제시. 다른 벤치마크나 실제 환경에서의 성능 검증 필요.
구체적인 아키텍처 세부 사항이나 구현 방식에 대한 깊이 있는 설명 부족.
실제 인간 피드백의 양과 질에 따른 성능 변화에 대한 분석 부족.
다양한 데이터베이스 스키마와 도메인에 대한 일반화 가능성 추가 연구 필요.
👍