Co-Evolving Complexity: An Adversarial Framework for Automatic MARL Curricula
Created by
Haebom
저자
Brennen Hill
개요
본 논문은 범용 인공지능 에이전트의 발전을 위해 환경의 복잡성, 다양성, 상호작용성을 확장하는 새로운 패러다임을 제안한다. 환경 생성 과정을 적대적 게임으로 설정하여, 공격자가 방어자의 약점을 공략하는 적대적 환경 구성을 학습하고, 방어자는 이러한 위협에 대응하는 협력 전략을 학습하도록 한다. 이 공진화적 동역학을 통해 무한히 생성되는 환경에서 에이전트가 훈련되어, 복잡하고 지능적인 행동이 나타나는 것을 확인한다.
시사점, 한계점
•
시사점:
◦
적대적 공진화를 통해 환경의 복잡성을 자동적으로 확장하여, 에이전트의 강건성과 전략적 깊이를 향상시킬 수 있다.
◦
수동으로 제작된 환경의 한계를 극복하고, 무한히 새로운 훈련 데이터를 제공한다.
◦
최소한의 훈련으로 복잡한 행동(예: 측면 공격, 방어)을 학습하는 에이전트의 등장을 확인했다.