Sign In

RAPTOR: Refined Approach for Product Table Object Recognition

Created by
  • Haebom
Category
Empty

저자

Eliott Thomas, Mickael Coustaty, Aurelie Joseph, Gaspar Deloin, Elodie Carel, Vincent Poulain D'Andecy, Jean-Marc Ogier

개요

본 논문은 다양한 형태의 표, 특히 제품 표 추출의 정확도를 높이기 위한 모듈형 후처리 시스템 RAPTOR를 제안합니다. 기존의 DETR 기반 표 추출 모델(TATR 등)은 다양한 표 형식과 부정확한 영역 탐지, 열 중복 등의 문제점을 가지고 있는데, RAPTOR는 이러한 문제점들을 해결하기 위해 설계되었습니다. RAPTOR는 표 탐지(TD)에는 DETR과 TATR을, 표 구조 인식(TSR)에는 TATR을 사용하며, 유전 알고리즘을 활용하여 모듈 매개변수를 최적화합니다. 제품 표 중심의 사내 데이터셋과 DOCILE, ICDAR 2013, ICDAR 2019 데이터셋을 사용하여 성능을 평가하였으며, 제품 표에 대한 우수한 성능과 다양한 표 형식에 대한 합리적인 성능을 보임을 확인하였습니다. 또한, 각 모듈의 기여도를 검증하는 ablation study를 수행하였습니다.

시사점, 한계점

시사점:
제품 표와 같이 특정 도메인에 특화된 표 추출 성능을 향상시키는 효과적인 후처리 시스템을 제시.
유전 알고리즘을 활용한 매개변수 최적화 기법을 통해 성능 향상을 도모.
다양한 표 형식에 대한 일반화 성능도 유지.
모듈별 기여도 분석을 통해 시스템의 신뢰성 확보.
한계점:
제품 표 중심의 사내 데이터셋을 사용하여 일반화 성능에 대한 추가적인 검증 필요.
특정 모델(DETR, TATR)에 의존적인 구조로, 다른 모델 적용 시 성능 변화 가능성 존재.
유전 알고리즘의 계산 비용이 상대적으로 높을 수 있음.
👍