Multi-agent reinforcement learning (MARL)은 협력 작업에서 강력한 결과를 달성했지만, 일반적으로 고정되고 완전히 제어된 팀을 가정합니다. Ad hoc teamwork (AHT)는 알려지지 않은 파트너와의 협업을 허용하여 이를 완화하지만, 기존 변형은 여전히 공유된 규칙을 전제로 합니다. 본 논문에서는 제어된 에이전트가 여러 개의 서로 생소한 제어되지 않은 팀 동료 그룹과 협력해야 하는 Multi-party Ad Hoc Teamwork (MAHT)를 소개합니다. 이를 해결하기 위해, 희소 스켈레톤 그래프를 구축하고 관계형 모델링을 적용하여 교차 그룹 역학을 포착하는 MARs를 제안합니다. MPE 및 StarCraft II 실험에서 MARs는 MARL 및 AHT 기준선을 능가하며 더 빠르게 수렴합니다.