Skeletons Matter: Dynamic Data Augmentation for Text-to-Query
Created by
Haebom
Category
Empty
저자
Yuchen Ji, Bo Xu, Jie Shi, Jiaqing Liang, Deqing Yang, Yu Mao, Hai Chen, Yanghua Xiao
개요
자연어 질문을 쿼리 언어로 변환하는 작업은 의미론적 구문 분석의 핵심적인 초점이었다. 대규모 언어 모델(LLM)의 발전은 이 분야의 발전을 가속화했지만, 기존 연구는 일반적으로 단일 쿼리 언어에 초점을 맞춰 다양한 언어 간 일반화 능력이 제한적이었다. 본 논문에서는 Text-to-Query 작업 패러다임을 공식적으로 정의하여 다양한 쿼리 언어에 걸쳐 의미론적 구문 분석 작업을 통합한다. 쿼리 스켈레톤을 Text-to-Query 작업의 공유 최적화 대상으로 식별하고, 이러한 스켈레톤 처리에 대한 모델별 약점을 명시적으로 진단하여 대상 훈련 데이터를 합성하는 일반적인 동적 데이터 증강 프레임워크를 제안한다. 4개의 Text-to-Query 벤치마크에 대한 실험을 통해, 제안된 방법이 소량의 합성 데이터만 사용하여 최첨단 성능을 달성함을 입증하며, 접근 방식의 효율성과 일반성을 강조한다.