[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Ensemble de données AnnoPage : ensemble de données d'éléments non textuels dans des documents avec catégorisation fine

Created by
  • Haebom

Auteur

Martin Ki\v{s}\v{s}, Michal Hradi\v{s}, Martina Dvo\v{r} akov a, V aclav Jirou\v{s}ek, Filip Kersch

Contour

Le jeu de données AnnoPage est un nouvel ensemble de données contenant 7 550 pages de documents historiques en tchèque et en allemand, de 1485 à nos jours. Il se concentre principalement sur les documents de la fin du XIXe et du début du XXe siècle et est conçu pour faciliter l'analyse de la mise en page et la recherche sur la détection d'objets. Chaque page est annotée à l'aide de cadres englobants alignés sur les axes (AABB) représentant 25 catégories d'éléments non textuels, notamment des images, des cartes, des éléments décoratifs et des diagrammes, conformément à la méthodologie tchèque de traitement des images de documents. Les annotations ont été rédigées par un bibliothécaire professionnel afin de garantir l'exactitude et la cohérence. Les pages de plusieurs jeux de données de documents historiques sont combinées afin d'accroître la variabilité et de maintenir la continuité. Le jeu de données est divisé en sous-ensembles de développement et de test, le jeu de test étant soigneusement sélectionné pour maintenir la distribution des catégories. Nous fournissons des résultats de référence utilisant les détecteurs d'objets YOLO et DETR afin de fournir une référence pour les recherches futures. Le jeu de données AnnoPage est accessible au public sur Zenodo, avec les annotations correctes au format YOLO.

Takeaways, Limitations

Takeaways:
Fournir un nouvel ensemble de données de haute qualité pour l'analyse de la mise en page et les études de détection d'objets de documents historiques
Fournir des annotations précises et cohérentes basées sur la méthodologie tchèque de traitement des documents d'image
Assurer la variabilité et la continuité de l'ensemble de données en incluant divers documents historiques
Fournir des performances de base basées sur YOLO et DETR pour fournir une base de comparaison pour les recherches futures
Augmenter l'évolutivité de la recherche grâce à des ensembles de données accessibles au public
Limitations:
Biais linguistique dans l'ensemble de données (principalement tchèque et allemand)
Biais temporel concentré à la fin du XIXe et au début du XXe siècle
Dépend d'une méthodologie spécifique de traitement de documents (méthodologie tchèque de traitement de documents d'image)
Portée de l'annotation limitée à 25 catégories d'éléments non textuels
👍