Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Continual Learning of Domain Knowledge from Human Feedback in Text-to-SQL

Created by
  • Haebom
Category
Empty

저자

Thomas Cook, Kelly Patel, Sivapriya Vellaichamy, Saba Rahimi, Zhen Zeng, Sumitra Ganesh

개요

대규모 언어 모델(LLM)은 자연어 질문으로부터 SQL 쿼리를 생성할 수 있지만, 데이터베이스 특정 스키마와 암묵적인 도메인 지식에 어려움을 겪습니다. 본 논문에서는 텍스트-SQL에서 인간 피드백으로부터 지속적으로 학습하는 프레임워크를 제시합니다. 학습 에이전트는 자연어 피드백을 받아 쿼리를 개선하고, 드러난 지식을 향후 작업에 재사용하기 위해 추출합니다. 이 추출된 지식은 구조화된 메모리에 저장되어 에이전트가 시간이 지남에 따라 실행 정확도를 향상시킬 수 있게 합니다. 다양한 학습 에이전트 아키텍처를 설계하고 평가하여 과거 경험을 포착하고 검색하는 방식을 비교합니다. BIRD 벤치마크 Dev set에 대한 실험 결과, 메모리 증강 에이전트, 특히 Procedural Agent가 human-in-the-loop 피드백을 활용하여 상당한 정확도 향상과 오류 감소를 달성했습니다. 본 연구 결과는 암묵적인 인간 전문 지식을 재사용 가능한 지식으로 변환하는 것의 중요성을 강조하며, human-in-the-loop로부터 지속적으로 학습하는 보다 적응적이고 도메인 인식적인 텍스트-SQL 시스템 개발의 길을 열어줍니다.

시사점, 한계점

시사점:
인간 피드백을 활용한 지속적인 학습을 통해 텍스트-SQL 시스템의 정확도 향상.
메모리 증강 에이전트, 특히 Procedural Agent의 효과 입증.
암묵적인 인간 전문 지식을 재사용 가능한 지식으로 변환하는 것의 중요성 강조.
더욱 적응적이고 도메인 인식적인 텍스트-SQL 시스템 개발의 가능성 제시.
한계점:
BIRD 벤치마크 Dev set에 대한 실험 결과만 제시.
다양한 학습 에이전트 아키텍처의 비교 분석, 추가적인 성능 개선 여지 존재.
실제 사용 시나리오에서의 성능 검증 필요.
👍