每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

基于期望最大化的多智能体强化学习中的潜在变量建模,用于无人机野生动物保护

Created by
  • Haebom

作者

马兹亚尔·塔加维、拉赫曼·法努什

使用基于 EM 的隐变量建模进行无人机协作:保护濒危野生动物

大纲

本文提出了一种基于期望最大化 (EM) 的新型隐变量建模方法,该方法能够在广阔且部分可观测的环境中实现实时响应,从而保护濒危野生动物免遭非法狩猎。该方法利用多智能体强化学习 (MARL),通过隐变量对隐藏的环境因素和智能体间动态进行建模,以增强不确定性条件下的导航和协调能力。该 EM-MARL 框架已通过定制模拟进行实施和评估,该模拟使用了十架无人机在濒危伊朗豹保护区内巡逻。

Takeaways,Limitations

与标准算法(PPO、DDPG)相比,在检测准确性、适应性和策略收敛性方面表现出卓越的性能。
结合 EM 推理和 MARL 有可能改善复杂、高风险保护场景中的分布式决策。
完整的实现、模拟环境和训练脚本可在 GitHub 上获取
👍