Cet article présente un nouveau cadre d'identification des doublons dans les documents anciens. Plus précisément, nous concevons un cadre avancé de détection des doublons combinant la correspondance de points clés de bas niveau et la correspondance de contenu textuelle de haut niveau pour l'un des documents anciens, Oracle Bones (OB). Comparé aux méthodes existantes de recherche et de correspondance d'images basées sur le contenu, notre modèle atteint des performances de rappel similaires et un score de rang inverse moyen simplifié plus élevé, tout en offrant une efficacité de calcul bien plus rapide. Grâce à des applications pratiques, nous avons découvert plus de 60 nouvelles paires de doublons OB que les experts traditionnels n'avaient pas réussi à détecter depuis des décennies. Nous avons publié le code, le modèle et les résultats réels sur GitHub.