Adaptively Coordinating with Novel Partners via Learned Latent Strategies
Created by
Haebom
Category
Empty
저자
Benjamin Li, Shuyang Shi, Lucia Romero, Huao Li, Yaqi Xie, Woojun Kim, Stefanos Nikolaidis, Michael Lewis, Katia Sycara, Simon Stepputtis
개요
본 논문은 이질적인 팀 구성원 간의 효과적인 협업을 위한 적응의 중요성을 강조하며, 특히 인간-에이전트 팀에서 에이전트가 인간 파트너에게 실시간으로 적응해야 하는 문제를 다룹니다. 시간 제약과 복잡한 전략 공간에서의 어려움을 해결하기 위해, 다양한 파트너 전략에 실시간으로 학습하고 적응하는 전략 조건부 협업자 프레임워크를 제안합니다. 이 프레임워크는 변분 오토인코더를 사용하여 잠재 전략 공간을 학습하고, 클러스터링을 통해 전략 유형을 식별하며, 각 전략 유형의 파트너를 생성하여 협업 에이전트를 훈련합니다. 새로운 파트너에 대한 온라인 적응을 위해, 고정 공유 후회 최소화 알고리즘을 활용하여 상호 작용 중 파트너의 전략 추정을 동적으로 추론하고 조정합니다. 오버쿡드 도메인(Overcooked domain)에서 제안된 에이전트의 성능을 평가하며, 기존 기준선과 비교하여 최첨단 성능을 달성함을 입증합니다.
시사점, 한계점
•
다양한 인간 및 에이전트 팀 동료와 협력하여 최첨단 성능을 달성하는 새로운 협업 에이전트 프레임워크 제시