Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Skeletons Matter: Dynamic Data Augmentation for Text-to-Query

Created by
  • Haebom
Category
Empty

저자

Yuchen Ji, Bo Xu, Jie Shi, Jiaqing Liang, Deqing Yang, Yu Mao, Hai Chen, Yanghua Xiao

개요

자연어 질문을 쿼리 언어로 변환하는 작업은 의미론적 구문 분석의 핵심적인 초점이었다. 대규모 언어 모델(LLM)의 발전은 이 분야의 발전을 가속화했지만, 기존 연구는 일반적으로 단일 쿼리 언어에 초점을 맞춰 다양한 언어 간 일반화 능력이 제한적이었다. 본 논문에서는 Text-to-Query 작업 패러다임을 공식적으로 정의하여 다양한 쿼리 언어에 걸쳐 의미론적 구문 분석 작업을 통합한다. 쿼리 스켈레톤을 Text-to-Query 작업의 공유 최적화 대상으로 식별하고, 이러한 스켈레톤 처리에 대한 모델별 약점을 명시적으로 진단하여 대상 훈련 데이터를 합성하는 일반적인 동적 데이터 증강 프레임워크를 제안한다. 4개의 Text-to-Query 벤치마크에 대한 실험을 통해, 제안된 방법이 소량의 합성 데이터만 사용하여 최첨단 성능을 달성함을 입증하며, 접근 방식의 효율성과 일반성을 강조한다.

시사점, 한계점

Text-to-Query 작업을 위한 통합된 패러다임 제시.
쿼리 스켈레톤을 공유 최적화 목표로 식별.
일반적인 동적 데이터 증강 프레임워크 제안.
소량의 합성 데이터로도 최첨단 성능 달성.
다양한 쿼리 언어에 대한 일반화 가능성 확보.
제공된 코드를 통해 연구 재현 및 활용 용이.
단일 쿼리 언어에 대한 성능 비교 정보 부재.
대규모 언어 모델 의존성 및 그로 인한 잠재적 한계.
👍