Sign In

Multi-party Agent Relation Sampling for Multi-party Ad Hoc Teamwork

Created by
  • Haebom
Category
Empty

저자

Beiwen Zhang, Yongheng Liang, Hejun Wu

개요

Multi-agent reinforcement learning (MARL)은 협력 작업에서 강력한 결과를 달성했지만, 일반적으로 고정되고 완전히 제어된 팀을 가정합니다. Ad hoc teamwork (AHT)는 알려지지 않은 파트너와의 협업을 허용하여 이를 완화하지만, 기존 변형은 여전히 공유된 규칙을 전제로 합니다. 본 논문에서는 제어된 에이전트가 여러 개의 서로 생소한 제어되지 않은 팀 동료 그룹과 협력해야 하는 Multi-party Ad Hoc Teamwork (MAHT)를 소개합니다. 이를 해결하기 위해, 희소 스켈레톤 그래프를 구축하고 관계형 모델링을 적용하여 교차 그룹 역학을 포착하는 MARs를 제안합니다. MPE 및 StarCraft II 실험에서 MARs는 MARL 및 AHT 기준선을 능가하며 더 빠르게 수렴합니다.

시사점, 한계점

시사점:
MAHT라는 새로운 AHT 설정 제시
MARs라는 새로운 모델 제안: 희소 스켈레톤 그래프 및 관계형 모델링을 활용하여 교차 그룹 역학 포착
MPE 및 StarCraft II에서 MARL 및 AHT 기준선보다 우수한 성능
빠른 수렴 속도
한계점:
구체적인 한계점은 논문 내용에서 명시되지 않음 (Abstract만 제공되었으므로)
👍