Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Normalized vs Diplomatic Annotation: A Case Study of Automatic Information Extraction from Handwritten Uruguayan Birth Certificates

Created by
  • Haebom

저자

Natalia Bottaioli (Universite Paris-Saclay, ENS Paris-Saclay, CNRS, Centre Borelli, France, Facultad de Ingenieria, Universidad de la Republica, Montevideo, Uruguay, Digital Sense, Montevideo, Uruguay), Solene Tarride (TEKLIA, Paris, France), Jeremy Anger (Universite Paris-Saclay, ENS Paris-Saclay, CNRS, Centre Borelli, France), Seginus Mowlavi (Universite Paris-Saclay, ENS Paris-Saclay, CNRS, Centre Borelli, France), Marina Gardella (IMPA, Rio de Janeiro, Brazil), Antoine Tadros (Universite Paris-Saclay, ENS Paris-Saclay, CNRS, Centre Borelli, France), Gabriele Facciolo (Universite Paris-Saclay, ENS Paris-Saclay, CNRS, Centre Borelli, France), Rafael Grompone von Gioi (Universite Paris-Saclay, ENS Paris-Saclay, CNRS, Centre Borelli, France), Christopher Kermorvant (TEKLIA, Paris, France), Jean-Michel Morel (City University of Hong Kong, Hong Kong), Javier Preciozzi (Facultad de Ingenieria, Universidad de la Republica, Montevideo, Uruguay, Digital Sense, Montevideo, Uruguay)

개요

본 연구는 우루과이 스페인어 필기체 출생 증명서로부터 핵심 정보를 추출하는 데 최근 제안된 문서 주의 네트워크(Document Attention Network, DAN)를 평가합니다. 필기체 문서의 자동 전사를 위한 두 가지 주석 전략을 연구하며, 최소한의 훈련 데이터와 주석 작업으로 DAN을 미세 조정합니다. 서로 다른 주석 방법을 사용하지만 동일한 이미지(15명 이상의 서기가 작성한 201개의 출생 증명서 스캔)를 포함하는 두 개의 데이터 세트에 대한 실험을 수행했습니다. 실험 결과, 날짜 및 출생 장소와 같이 표준화할 수 있는 필드에는 정규화된 주석이 더 효과적이고, 표준화할 수 없는 이름과 성을 포함하는 필드에는 외교적 주석이 훨씬 더 우수한 성능을 보임을 나타냅니다.

시사점, 한계점

시사점: 필기체 문서에서 키-값 정보 추출을 위한 DAN의 효용성을 검증하고, 데이터의 특성에 따라 최적의 주석 전략(정규화 vs. 외교적 주석)을 선택해야 함을 시사합니다. 최소한의 데이터로 DAN을 효과적으로 미세 조정하는 방법을 제시합니다.
한계점: 실험에 사용된 데이터셋의 크기가 제한적(201개 스캔)이며, 다양한 필기체 스타일을 충분히 반영하지 못했을 가능성이 있습니다. 다른 언어나 필기체 유형에 대한 일반화 가능성에 대한 추가 연구가 필요합니다. 두 가지 주석 전략 외 다른 전략에 대한 비교 분석이 부족합니다.
👍