PDF 파일, 웹 페이지 등 다양한 문서 형식 내의 표 형식 데이터는 정부, 엔지니어링, 과학, 비즈니스 등 다양한 분야에서 널리 사용된다. 이러한 인간 중심 표(HCT)는 높은 비즈니스 가치, 복잡한 레이아웃, 제한된 운영 능력, 그리고 때로는 중요한 통찰력을 위한 유일한 데이터 소스로서의 역할을 수행한다. 하지만 이러한 복잡성으로 인해 전통적인 데이터 추출, 처리 및 쿼리 방식에 상당한 어려움이 발생한다. 기존 해결책은 이러한 표를 SQL 쿼리에 적합하도록 관계형 형식으로 변환하는 데 중점을 두지만, HCT의 다양하고 복잡한 레이아웃을 처리하는 데 한계가 있다. 본 논문은 수천 개의 표에 대한 HCT, 자연어 쿼리 및 관련 답변으로 구성된 광범위한 HCT-QA 벤치마크를 설명한다. 이 데이터 세트는 2,188개의 실제 HCT, 9,835개의 QA 쌍, 4,679개의 합성 표, 67.5K QA 쌍을 포함한다. 다양한 유형의 쿼리 엔진으로 HCT를 처리할 수 있지만, 본 논문에서는 대규모 언어 모델을 잠재적인 엔진으로 사용하여 이러한 표를 처리하고 쿼리하는 능력을 평가한다.