本文研究了脆弱代理识别 (VAI) 问题,以解决大规模多智能体强化学习 (MARL) 系统中部分智能体失效的问题。我们将 VAI 问题定义为分层对抗分布式平均场控制 (HAD-MFC)。在高层,我们解决选择最脆弱代理的 NP 难组合问题;而在低层,我们解决使用平均场 MARL 为这些代理学习最坏情况对抗策略的问题。我们使用 Fenchel-Rockafellar 变换将分层过程解耦,以获得一个高层正则化平均场贝尔曼算子,使各层能够独立学习,从而降低计算复杂度。然后,我们将高层组合问题重构为一个基于正则化平均场贝尔曼算子、具有密集奖励的马尔可夫决策过程 (MDP),并依次使用贪婪算法和强化学习算法识别最脆弱代理。这种分解保留了原始 HAD-MFC 的最优解。实验结果表明,我们的方法能够有效地识别大规模 MARL 和基于规则的系统中更脆弱的代理,引发更严重的故障,并学习反映每个代理脆弱性的价值函数。