본 논문은 대규모 다중 에이전트 강화학습(MARL)에서 차원의 저주 문제를 해결하기 위해 이중 수준 평균장(BMF) 기법을 제안합니다. 기존 평균장(MF) 방법은 에이전트 간 상호작용을 단순화하여 계산 복잡도를 줄이지만, 개별 에이전트의 차이를 고려하지 못하는 한계가 있습니다. BMF는 변분 오토인코더(VAE)를 이용하여 에이전트를 동적으로 그룹핑하고, 그룹 간 및 그룹 내 상호작용을 이중 수준으로 모델링함으로써 개별 에이전트의 다양성을 포착하고 집계 노이즈를 완화합니다. 다양한 실험을 통해 BMF가 기존 최첨단 방법보다 우수한 성능을 보임을 확인하였습니다.