Cet article présente un nouveau cadre d'investigation systématique des vulnérabilités des décodeurs de réseaux de neurones graphes (GNN) pour la correction d'erreurs quantiques (QEC) à l'aide d'agents d'apprentissage par renforcement (RL). L'agent RL est entraîné comme un adversaire, recherchant la correction du syndrome minimal responsable de la classification erronée du décodeur. En appliquant ce cadre à un décodeur de réseau d'attention graphes (GAT) entraîné sur des données de code de surface expérimentales de Google Quantum AI, nous démontrons que l'agent RL identifie avec succès des vulnérabilités critiques spécifiques avec un taux de réussite d'attaque élevé et des inversions de bits minimales. De plus, nous démontrons que l'entraînement antagoniste, qui reforme le modèle à l'aide d'exemples antagonistes générés par l'agent RL, peut améliorer significativement la robustesse du décodeur. Ce processus itératif de découverte automatisée des vulnérabilités et de reformation ciblée constitue une méthodologie prometteuse pour le développement de décodeurs de réseaux de neurones plus fiables et plus robustes pour l'informatique quantique tolérante aux pannes.