본 논문은 문서 질문 응답(QA)을 위한 통합 데이터셋을 제시합니다. 이 데이터셋은 문서 AI 및 시각적으로 풍부한 문서 이해(VRDU)와 관련된 여러 공개 데이터셋을 결합하여 얻어졌습니다. 주요 기여는 두 가지입니다. 첫째, 정보 추출(IE)과 같은 기존 문서 AI 작업을 질문 응답 작업으로 재구성하여 대규모 언어 모델 훈련 및 평가에 적합한 리소스를 제공합니다. 둘째, 모든 문서의 OCR을 공개하고, 문서 이미지 내에서 정답의 정확한 위치를 바운딩 박스로 포함합니다. 이 데이터셋을 사용하여, 바운딩 박스 정보를 포함할 수 있는 다양한 프롬프팅 기법이 오픈 웨이트 모델의 성능에 미치는 영향을 탐구하고, 문서 이해에 가장 효과적인 접근 방식을 식별합니다.