Visually Rich Document Understanding (VRDU) 분야에서 복잡한 레이아웃, 다양한 이해관계자, 높은 구조적 변동성을 가진 양식 문서 처리의 어려움을 해결하기 위해 VRD-IU 경진대회가 개최되었습니다. Form-NLU 데이터셋(디지털, 인쇄, 필기 문서 포함)을 사용하여 다양한 형식의 양식에서 주요 정보를 추출하고 위치를 파악하는 것을 목표로 하였습니다. 경진대회는 엔티티 기반 주요 정보 검색에 초점을 맞춘 Track A와 원본 문서 이미지에서 주요 정보의 end-to-end 위치 파악을 목표로 하는 Track B의 두 트랙으로 구성되었으며, 20개 이상의 팀이 참여하여 계층적 분해, Transformer 기반 검색, 다중 모드 특징 융합, 고급 객체 탐지 기술 등 다양한 최첨단 방법론을 선보였습니다. 최고 성능 모델들은 VRDU에서 새로운 기준을 설정하여 문서 정보 추출 분야에 귀중한 통찰력을 제공했습니다.