BiblioPage는 다양한 형식의 역사적 및 현실 세계 아카이브에서 수동으로 서지 메타데이터를 디지털화하는 데 드는 시간과 노력을 줄이기 위해 고안된, 주석이 달린 스캔된 제목 페이지 데이터셋입니다. 체코 14개 도서관에서 수집한 약 2,000개의 단행본 제목 페이지로 구성되며, 제목, 기여자, 출판 메타데이터 등 16개의 서지 속성과 바운딩 박스 형태의 정확한 위치 정보가 포함되어 있습니다. YOLO 및 DETR과 같은 객체 탐지 모델과 Transformer 기반 OCR을 결합하여 구조화된 정보를 추출하는 실험을 진행하여 최대 mAP 52, F1 점수 59를 달성했으며, Llama 3.2-Vision 및 GPT-4o 등 다양한 시각적 거대 언어 모델을 평가하여 최대 F1 점수 67을 달성했습니다. BiblioPage는 서지 메타데이터 추출을 위한 현실 세계 벤치마크 역할을 하며, 문서 이해, 문서 질의응답 및 문서 정보 추출에 기여합니다. 데이터셋과 평가 스크립트는 GitHub에서 이용 가능합니다.