MIR: Efficient Exploration in Episodic Multi-Agent Reinforcement Learning via Mutual Intrinsic Reward
Created by
Haebom
Category
Empty
저자
Kesheng Chen, Wenjian Luo, Bang Zhang, Zeping Yin, Zipeng Ye
Mutual Intrinsic Reward (MIR) for Multi-Agent Reinforcement Learning with Sparse Rewards
개요
본 논문은 에피소드 보상과 같이 희소한 보상을 받는 환경에서 다중 에이전트 강화 학습(MARL) 문제를 해결하기 위해 Mutual Intrinsic Reward (MIR)를 제안한다. MIR은 에이전트들이 팀원에게 영향을 미치는 행동을 탐색하도록 유도하여 팀 탐색을 촉진하고 알고리즘 성능을 향상시킨다. 이를 위해 MiniGrid 환경을 MARL 환경인 MiniGrid-MA로 확장하여 MIR의 성능을 평가하고, 최첨단 기법들과 비교하여 우수한 성능을 입증했다.