TARGET: Benchmarking Table Retrieval for Generative Tasks
Created by
Haebom
저자
Xingyu Ji, Parker Glenn, Aditya G. Parameswaran, Madelon Hulsebos
개요
본 논문은 구조화된 데이터에 대한 분석 질의나 작업을 위해 적절한 테이블을 검색하는 문제를 해결하기 위한 벤치마크 TARGET을 소개합니다. 구조화된 데이터는 조직에 높은 가치를 지니며, 데이터 분석과 머신러닝 분야에서 중요한 응용 프로그램을 주도합니다. 최근 표현 학습 및 생성 모델의 발전으로 텍스트-SQL을 활용하는 등 구조화된 데이터에 대한 자연어 인터페이스가 개발되었습니다. 본 논문에서는 검색 증강 생성을 통해 대화형 인터페이스 또는 에이전트 구성 요소를 통해 구조화된 데이터에서 상호 작용의 맥락을 제공함으로써 답변의 신선도, 정확성 및 포괄성을 크게 향상시킬 수 있다는 점을 강조합니다. 핵심 질문은 분석 질의 또는 작업에 적합한 테이블을 어떻게 검색하는가 입니다. TARGET 벤치마크를 통해 다양한 검색 기법의 성능을 독립적으로 분석하고, 후속 작업에 미치는 영향을 평가합니다. 밀집 임베딩 기반 검색 기법이 BM25 기준보다 훨씬 우수한 성능을 보이며, 메타데이터(예: 누락된 테이블 제목)에 대한 검색 기법의 민감도와 데이터셋 및 작업 전반에 걸친 검색 성능의 큰 차이를 보여줍니다. TARGET 벤치마크는 https://target-benchmark.github.io 에서 이용 가능합니다.