Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Bi-level Mean Field: Dynamic Grouping for Large-Scale MARL

Created by
  • Haebom

저자

Yuxuan Zheng, Yihe Zhou, Feiyang Xu, Mingli Song, Shunyu Liu

개요

대규모 다중 에이전트 강화 학습(MARL)은 에이전트 상호작용의 기하급수적 증가로 인해 차원의 저주 문제를 겪는다. 기존의 평균장(MF) 방법은 이 문제를 완화하기 위해 인접 에이전트를 단일 평균 에이전트로 근사하여 상호작용을 단순화하지만, 개별 에이전트의 차이를 고려하지 못해 집계 노이즈를 발생시킨다. 본 논문에서는 동적 그룹핑을 사용하는 이중 레벨 평균장(BMF) 방법을 제안하여 대규모 MARL에서 에이전트 다양성을 포착하고 이중 레벨 상호작용을 통해 집계 노이즈를 완화한다. BMF는 VAE(Variational AutoEncoder)를 사용하여 에이전트 표현을 학습하고 동적 그룹핑을 수행하는 동적 그룹 할당 모듈과 그룹 간 및 그룹 내 상호작용을 모델링하는 이중 레벨 상호작용 모듈을 도입한다. 다양한 실험 결과, BMF는 최첨단 방법보다 우수한 결과를 보였다.

시사점, 한계점

시사점:
대규모 MARL에서 에이전트 다양성을 효과적으로 고려하는 새로운 방법 제시.
동적 그룹핑과 이중 레벨 상호작용을 통해 평균장 방법의 한계인 집계 노이즈 문제 완화.
다양한 실험을 통해 BMF의 우수성 검증.
한계점:
VAE를 이용한 에이전트 표현 학습의 성능이 전체 시스템 성능에 영향을 미칠 수 있음.
동적 그룹핑 전략의 최적화에 대한 추가적인 연구가 필요할 수 있음.
특정 유형의 MARL 문제에 대해서만 우수한 성능을 보일 가능성 존재.
👍