Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ST-Raptor: LLM-Powered Semi-Structured Table Question Answering

Created by
  • Haebom

저자

Zirui Tang, Boyu Niu, Xuanhe Zhou, Boxiu Li, Wei Zhou, Jiannan Wang, Guoliang Li, Xinyi Zhang, Fan Wu

개요

본 논문은 실세계 응용 프로그램에서 널리 사용되는 반정형 테이블의 질의응답을 자동화하는 새로운 프레임워크인 ST-Raptor를 제안합니다. 반정형 테이블은 계층적 헤더와 병합된 셀 등 복잡한 레이아웃을 가지므로 기존의 NL2SQL, NL2Code, 다중 모달 LLM QA 방법으로는 정확한 질의응답이 어렵습니다. ST-Raptor는 계층적 직교 트리(HO-Tree)를 이용하여 복잡한 레이아웃을 표현하고, 기본적인 트리 연산을 통해 LLM이 질문을 처리하도록 합니다. 사용자 질문을 하위 질문으로 분해하고, 트리 연산 파이프라인을 생성하며, 정확한 파이프라인 실행을 위해 연산-테이블 정렬을 수행합니다. 또한, 전방 검증과 후방 검증을 통해 결과의 정확성을 높입니다. 102개의 실제 반정형 테이블과 764개의 질문으로 구성된 새로운 데이터셋 SSTQA를 제시하여 성능을 평가하였으며, 기존 방법들보다 최대 20% 향상된 정확도를 달성했습니다.

시사점, 한계점

시사점:
반정형 테이블 질의응답 문제에 대한 효과적인 접근 방식을 제시합니다.
복잡한 테이블 레이아웃을 효과적으로 처리하는 HO-Tree 모델과 트리 연산 기반의 프레임워크를 제안합니다.
두 단계 검증 메커니즘을 통해 응답의 신뢰성을 향상시킵니다.
새로운 벤치마크 데이터셋 SSTQA를 제공합니다.
기존 방법 대비 최대 20% 향상된 정확도를 보여줍니다.
한계점:
SSTQA 데이터셋의 규모가 상대적으로 작을 수 있습니다.
HO-Tree 모델이 모든 유형의 반정형 테이블 레이아웃을 완벽하게 포착하지 못할 수 있습니다.
LLM의 성능에 의존적이며, LLM의 한계가 ST-Raptor의 성능에 영향을 미칠 수 있습니다.
다양한 유형의 질문에 대한 일반화 성능이 추가적으로 검증되어야 합니다.
👍