# General Table Question Answering via Answer-Formula Joint Generation

### 저자

Zhongyuan Wang, Richong Zhang, Zhijie Nie

### 개요

본 논문은 대규모 언어 모델(LLM)을 이용한 TableQA(표 질의응답) 문제 해결을 위해 스프레드시트 수식을 실행 가능한 표현으로 사용하는 새로운 접근 방식을 제시합니다.  기존 TableQA 방법들이 다양한 질문 유형이나 표 구조에 대한 적응력이 부족한 점을 보완하기 위해,  다양한 구조의 표에서 복잡한 추론 문제를 해결하는 데 스프레드시트 수식을 활용합니다.  기존 데이터셋을 기반으로 수식 주석이 달린 대규모 TableQA 데이터셋인 FormulaQA를 구축하고, 다양한 유형의 표와 질문에 동시에 대응 가능한 일반적인 표 질의응답 프레임워크인 TabAF를 제안합니다. TabAF는 단일 LLM 백본으로 답변과 수식을 모두 생성하여, 기존 방법들보다 뛰어난 다양성과 일반화 성능을 보여주며, Llama3.1-70B 기반 TabAF는 WikiTableQuestion, HiTab, TabFact 데이터셋에서 최첨단 성능을 달성합니다.

### 시사점, 한계점

- **시사점:**

    - 스프레드시트 수식을 TableQA에 활용하여 다양한 표 구조와 질문 유형에 대한 적응력 향상.

    - 단일 LLM 백본으로 답변과 수식을 동시에 생성하는 TabAF의 효율성과 일반화 성능 증명.

    - WikiTableQuestion, HiTab, TabFact 데이터셋에서 최첨단 성능 달성.

    - FormulaQA라는 새로운 대규모 TableQA 데이터셋 구축.

- **한계점:**

    - 제시된 TabAF의 성능이 특정 LLM(Llama3.1-70B)에 의존적일 가능성.

    - 다른 유형의 LLM이나 데이터셋에 대한 일반화 성능에 대한 추가적인 검증 필요.

    - 스프레드시트 수식의 표현력 한계로 인해 해결할 수 없는 복잡한 질문 유형이 존재할 가능성.

[PDF 보기](https://arxiv.org/pdf/2503.12345)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).