OmniDocBench: Benchmarking Diverse PDF Document Parsing with Comprehensive Annotations
Created by
Haebom
Category
Empty
저자
Linke Ouyang, Yuan Qu, Hongbin Zhou, Jiawei Zhu, Rui Zhang, Qunshu Lin, Bin Wang, Zhiyuan Zhao, Man Jiang, Xiaomeng Zhao, Jin Shi, Fan Wu, Pei Chu, Minghao Liu, Zhenxiang Li, Chao Xu, Bo Zhang, Botian Shi, Zhongying Tu, Conghui He
개요
OmniDocBench는 대규모 언어 모델(LLM)과 검색 증강 생성(RAG) 시스템의 데이터 요구를 충족하는 컴퓨터 비전 분야의 문서 콘텐츠 추출 작업을 위한 새로운 벤치마크입니다. 기존 벤치마크의 문서 유형 범위가 좁고 평가 절차가 단순화되어 현실적이지 않다는 점을 해결하기 위해, 학술 논문, 교과서, 필기 노트, 빽빽하게 인쇄된 신문 등 9가지 문서 소스에 걸쳐 고품질 주석을 제공합니다. 19개의 레이아웃 범주와 15개의 속성 레이블을 사용하여 엔드투엔드 평가부터 작업별 및 속성 기반 분석까지 유연하고 다단계 평가를 지원합니다. 파이프라인 기반 방법과 엔드투엔드 비전-언어 모델을 철저히 평가하여 다양한 문서 유형에 대한 강점과 약점을 밝힙니다. 다양하고 세분화된 문서 파싱 평가를 위한 새로운 표준을 제시하며, 데이터셋과 코드는 https://github.com/opendatalab/OmniDocBench 에서 이용 가능합니다.