본 논문은 협력적 다중 에이전트 강화 학습(MARL)에서 에이전트 수에 따라 지수적으로 증가하는 상태 공간으로 인한 순열 문제와 기존 구조의 확장성 한계를 해결하기 위해 새로운 에이전트 네트워크와 비선형 믹싱 네트워크를 제안합니다. 제안하는 방법은 순열 동변성과 확장성을 보장하여 다양한 수의 에이전트가 있는 환경에 일반화될 수 있도록 설계되었습니다. 에이전트 네트워크는 계산 복잡성을 크게 줄이고, 확장 가능한 하이퍼네트워크는 비선형 믹싱을 위한 효율적인 가중치 생성을 가능하게 합니다. 커리큘럼 학습을 도입하여 훈련 효율을 향상시켰으며, SMACv2와 Google Research Football (GRF) 실험을 통해 기존 방법보다 우수한 학습 성능을 달성함을 보여줍니다.