Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Adaptively Coordinating with Novel Partners via Learned Latent Strategies

Created by
  • Haebom
Category
Empty

저자

Benjamin Li, Shuyang Shi, Lucia Romero, Huao Li, Yaqi Xie, Woojun Kim, Stefanos Nikolaidis, Michael Lewis, Katia Sycara, Simon Stepputtis

개요

본 논문은 이질적인 팀 구성원 간의 효과적인 협업을 위한 적응의 중요성을 강조하며, 특히 인간-에이전트 팀에서 에이전트가 인간 파트너에게 실시간으로 적응해야 하는 문제를 다룹니다. 시간 제약과 복잡한 전략 공간에서의 어려움을 해결하기 위해, 다양한 파트너 전략에 실시간으로 학습하고 적응하는 전략 조건부 협업자 프레임워크를 제안합니다. 이 프레임워크는 변분 오토인코더를 사용하여 잠재 전략 공간을 학습하고, 클러스터링을 통해 전략 유형을 식별하며, 각 전략 유형의 파트너를 생성하여 협업 에이전트를 훈련합니다. 새로운 파트너에 대한 온라인 적응을 위해, 고정 공유 후회 최소화 알고리즘을 활용하여 상호 작용 중 파트너의 전략 추정을 동적으로 추론하고 조정합니다. 오버쿡드 도메인(Overcooked domain)에서 제안된 에이전트의 성능을 평가하며, 기존 기준선과 비교하여 최첨단 성능을 달성함을 입증합니다.

시사점, 한계점

다양한 인간 및 에이전트 팀 동료와 협력하여 최첨단 성능을 달성하는 새로운 협업 에이전트 프레임워크 제시
실시간 적응을 위한 잠재 전략 공간 학습 및 전략 유형 식별
온라인 적응을 위한 고정 공유 후회 최소화 알고리즘 활용
오버쿡드 도메인에서 제안된 방법의 효과 입증
구체적인 한계점은 논문에 명시되지 않음 (논문 요약에서 확인 불가)
👍