Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Conditional Diffusion Model for Multi-Agent Dynamic Task Decomposition

Created by
  • Haebom
Category
Empty

저자

Yanda Zhu, Yuanyang Zhu, Daoyi Dong, Caihua Chen, Chunlin Chen

개요

복잡한 협력적 다중 에이전트 강화 학습(MARL) 과제에서 동적 작업 분해를 위한 새로운 이중 계층적 MARL 프레임워크인 C$\text{D}^\text{3}$T(Conditional Diffusion Model for Dynamic Task Decomposition)를 제시합니다. C$\text{D}^\text{3}$T는 subtask 및 조정 패턴을 자동으로 추론하도록 설계되었으며, 고차 정책은 subtask 효과를 기반으로 subtask 선택 전략을 생성하기 위해 subtask 표현을 학습합니다. 환경에 대한 subtask의 효과를 포착하기 위해 조건부 확산 모델을 사용하여 다음 관찰 및 보상을 예측합니다. 저차 수준에서 에이전트는 할당된 subtask 내에서 전문화된 기술을 협력적으로 학습하고 공유합니다. 또한, 학습된 subtask 표현은 multi-head attention mixing network에서 추가 의미 정보로 사용되어 가치 분해를 향상시키고 개별 및 결합 가치 함수 간의 효율적인 추론 다리를 제공합니다.

시사점, 한계점

동적 작업 분해를 위한 새로운 MARL 프레임워크 제안.
자동으로 subtask 및 조정 패턴을 추론하는 이중 계층적 구조.
조건부 확산 모델을 사용하여 subtask 효과를 포착.
가치 분해를 향상시키기 위해 subtask 표현을 활용하는 multi-head attention mixing network.
기존 baseline보다 우수한 성능을 보임.
학습에 필요한 샘플 수에 대한 언급은 없지만, 확산 모델의 특성상 계산 비용이 높을 수 있음.
복잡한 환경에서 동적 작업 분해를 학습하는 데 필요한 샘플 수에 대한 추가 분석 필요.
👍