Partner Modelling Emerges in Recurrent Agents (But Only When It Matters)
Created by
Haebom
저자
Ruaridh Mon-Williams, Max Taylor-Davies, Elizabeth Mieczkowski, Natalia Velez, Neil R. Bramley, Yanwei Wang, Thomas L. Griffiths, Christopher G. Lucas
개요
본 논문은 인간의 협업 능력, 특히 새로운 파트너의 강점과 약점을 파악하여 공동 목표를 달성하는 능력을 인공지능 시스템에 구현하는 문제를 다룬다. 이를 위해 모델 기반이 아닌 단순한 RNN 에이전트를 다양한 파트너들과 협업하도록 훈련시키고, Overcooked-AI 환경에서 수천 개의 협업 팀 데이터를 수집하여 에이전트의 내부 은닉 상태를 분석했다. 추가적인 아키텍처 기능, 유도적 편향 또는 보조 목표 없이도 에이전트는 파트너의 작업 능력에 대한 구조화된 내부 표현을 개발하여 새로운 협력자에게 빠르게 적응하고 일반화하는 능력을 보였다. 탐색 기법과 대규모 행동 분석을 통해 이러한 내부 모델을 조사한 결과, 에이전트가 작업 할당을 제어하여 파트너의 행동에 영향을 줄 수 있을 때 구조화된 파트너 모델링이 나타나는 것을 발견했다. 결론적으로, 모델 기반이 아닌 에이전트에서도 적절한 사회적 압력이 가해지는 환경 조건 하에서는 파트너 모델링이 자발적으로 발생할 수 있음을 보여준다.
시사점, 한계점
•
시사점:
◦
모델 기반이 아닌 에이전트에서도 적절한 환경 조건 하에 파트너 모델링이 자발적으로 발생할 수 있음을 밝힘.