Cet article présente ATHAR, un ensemble de données à grande échelle et de haute qualité pour la traduction anglaise de la littérature arabe classique. Il souligne l'importance de la littérature arabe classique et la nécessité de la traduction, tout en abordant les limites des ensembles de données existants, limités. L'ensemble de données ATHAR comprend 6 600 échantillons de traduction de haute qualité couvrant divers domaines, notamment les sciences, la culture et la philosophie. Il démontre la nécessité et l'applicabilité de cet ensemble de données grâce à des évaluations de performance de modèles linguistiques à grande échelle (LLM) de pointe. Il est accessible au public sur le HuggingFace Data Hub.