每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

大规模多智能体强化学习中的脆弱智能体识别

Created by
  • Haebom

作者

李思敏、郑宇伟、毛子豪、王林浩、徐瑞晓、马成东、于欣、马雨晴、窦奇、王欣、罗杰、安博、杨耀东、吕伟峰、刘翔龙

大纲

本文研究了脆弱代理识别 (VAI) 问题,以解决大规模多智能体强化学习 (MARL) 系统中部分智能体失效的问题。我们将 VAI 问题定义为分层对抗分布式平均场控制 (HAD-MFC)。在高层,我们解决选择最脆弱代理的 NP 难组合问题;而在低层,我们解决使用平均场 MARL 为这些代理学习最坏情况对抗策略的问题。我们使用 Fenchel-Rockafellar 变换将分层过程解耦,以获得一个高层正则化平均场贝尔曼算子,使各层能够独立学习,从而降低计算复杂度。然后,我们将高层组合问题重构为一个基于正则化平均场贝尔曼算子、具有密集奖励的马尔可夫决策过程 (MDP),并依次使用贪婪算法和强化学习算法识别最脆弱代理。这种分解保留了原始 HAD-MFC 的最优解。实验结果表明,我们的方法能够有效地识别大规模 MARL 和基于规则的系统中更脆弱的代理,引发更严重的故障,并学习反映每个代理脆弱性的价值函数。

Takeaways, Limitations

Takeaways:
一种解决大规模 MARL 系统中部分代理故障问题的新方法。
提出了一种通过有效分解分层问题来降低计算复杂度的方法。
提出一种有效识别脆弱代理和分析系统漏洞的方法。
通过实验验证了所提方法的有效性
Limitations:
所提出方法的性能可能因问题的大小和复杂性而异。
该实验局限于特定的系统和环境,需要进一步研究其普遍性。
由于它采用近似解决NP难问题的方法,因此无法保证最优解。
👍