Este artículo presenta ATHAR, un conjunto de datos a gran escala y de alta calidad para la traducción al inglés de la literatura árabe clásica. Destaca la importancia de la literatura árabe clásica y la necesidad de su traducción, a la vez que aborda las limitaciones de los limitados conjuntos de datos existentes. El conjunto de datos ATHAR comprende 6600 muestras de traducción de alta calidad que abarcan diversos campos, como la ciencia, la cultura y la filosofía. Demuestra la necesidad y la aplicabilidad de este conjunto de datos mediante evaluaciones del rendimiento de modelos lingüísticos a gran escala (LLM) de vanguardia. Está disponible públicamente en el Centro de Datos HuggingFace.