Explainable Coarse-to-Fine Ancient Manuscript Duplicates Discovery
Created by
Haebom
저자
Chongsheng Zhang, Shuwen Wu, Yingqi Chen, Yi Men, Gaojuan Fan, Matthias A{\ss}enmacher, Christian Heumann, Joao Gama
개요
본 논문은 고대 문서의 중복물을 식별하는 새로운 프레임워크를 제시합니다. 특히, 고대 문서 중 하나인 Oracle Bones (OB)를 대상으로, 저수준 키포인트 매칭과 고수준 텍스트 중심 콘텐츠 기반 매칭을 결합한 진보적인 중복 발견 프레임워크를 설계했습니다. 기존의 콘텐츠 기반 이미지 검색 및 이미지 매칭 방법과 비교하여, 본 논문의 모델은 비슷한 재현율 성능과 더 높은 단순화된 평균 역순위 점수를 보이며, 훨씬 빠른 계산 효율성을 달성했습니다. 실제 적용을 통해 기존 전문가들이 수십 년 동안 발견하지 못했던 60쌍 이상의 새로운 OB 중복물을 발견했습니다. GitHub에 코드, 모델 및 실제 결과를 공개했습니다.
시사점, 한계점
•
시사점:
◦
고대 문서 중복물 식별을 위한 효율적이고 정확한 새로운 프레임워크 제시.
◦
저수준 및 고수준 특징을 결합한 접근 방식의 효용성 증명.
◦
실제 세계 적용을 통한 새로운 중복물 발견 및 고고학적, 역사적 연구에 기여.
◦
기존 방법보다 향상된 성능(재현율, 평균 역순위 점수, 계산 효율) 달성.
•
한계점:
◦
Oracle Bones에 특화된 모델이므로 다른 종류의 고대 문서에는 적용 가능성이 제한적일 수 있음.
◦
모델의 일반화 성능 및 다양한 유형의 중복(예: 부분적인 중복)에 대한 로버스트성에 대한 추가 연구 필요.