Dans cet article, nous présentons DRAGON (Dynamic RAG Benchmark On News), le premier benchmark RAG (Retrieval-Augmented Generation) dynamique pour la langue russe. DRAGON s'appuie sur un corpus d'actualités et de documents publics russes régulièrement mis à jour et fournit une évaluation complète des composants de recherche et de génération. Il génère automatiquement des questions à l'aide d'un graphe de connaissances généré à partir du corpus et extrait quatre types de questions clés selon des modèles de sous-graphes. Nous publions un cadre d'évaluation complet, comprenant un pipeline de génération automatique de questions, des scripts d'évaluation (réutilisables dans toutes les langues et environnements multilingues), des données de benchmark, ainsi qu'un classement public pour encourager la participation et la comparaison de la communauté. Il surmonte les limites des benchmarks RAG statiques centrés sur l'anglais existants et fournit une ressource pour évaluer les systèmes RAG russes qui reflète la nature dynamique des environnements réels.