대규모 다중 에이전트 강화 학습(MARL)은 에이전트 상호작용의 기하급수적 증가로 인해 차원의 저주 문제를 겪는다. 기존의 평균장(MF) 방법은 이 문제를 완화하기 위해 인접 에이전트를 단일 평균 에이전트로 근사하여 상호작용을 단순화하지만, 개별 에이전트의 차이를 고려하지 못해 집계 노이즈를 발생시킨다. 본 논문에서는 동적 그룹핑을 사용하는 이중 레벨 평균장(BMF) 방법을 제안하여 대규모 MARL에서 에이전트 다양성을 포착하고 이중 레벨 상호작용을 통해 집계 노이즈를 완화한다. BMF는 VAE(Variational AutoEncoder)를 사용하여 에이전트 표현을 학습하고 동적 그룹핑을 수행하는 동적 그룹 할당 모듈과 그룹 간 및 그룹 내 상호작용을 모델링하는 이중 레벨 상호작용 모듈을 도입한다. 다양한 실험 결과, BMF는 최첨단 방법보다 우수한 결과를 보였다.