Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

FS-DAG: Few Shot Domain Adapting Graph Networks for Visually Rich Document Understanding

Created by
  • Haebom
Category
Empty

저자

Amit Agarwal, Srikant Panda, Kulbhushan Pachauri

개요

본 논문은 적은 수의 훈련 데이터로 시각적으로 풍부한 문서 이해(VRDU)를 수행하기 위한 확장 가능하고 효율적인 모델 아키텍처인 Few Shot Domain Adapting Graph (FS-DAG)를 제안합니다. FS-DAG는 최소한의 데이터로 다양한 문서 유형에 적응하기 위해 도메인별 및 언어/비전 관련 백본을 모듈식 프레임워크 내에서 활용합니다. 이 모델은 OCR 오류, 오타 및 도메인 변화와 같은 실제 문제에 강하며, 정보 추출(IE) 작업에 적합하도록 9천만 개 미만의 매개변수로 고성능을 제공합니다. FS-DAG는 정보 추출 작업에 대한 광범위한 실험을 통해 최첨단 방법보다 수렴 속도와 성능을 크게 향상시켰습니다.

시사점, 한계점

시사점:
소량의 데이터로도 시각적 문서 이해가 가능한 FS-DAG 모델 제안.
OCR 오류, 오타, 도메인 변화에 대한 강건함.
9천만 개 미만의 매개변수로 효율적인 성능 제공.
정보 추출 작업에서 기존 방법 대비 향상된 성능.
더 작고 효율적인 모델 개발의 진전.
한계점:
본 논문에서 구체적인 한계점에 대한 언급은 없음.
👍