본 논문은 다중 에이전트 강화 학습(MARL)에서 팀 협업을 용이하게 하기 위해 새로운 표현 학습 프레임워크인 IWoL(Interactive World Latent)을 제시합니다. 다중 에이전트 상호 작용과 지역 관측으로 인한 불완전한 정보로 인해 팀 협업을 위한 효과적인 표현을 구축하는 것은 어려운 문제입니다. IWoL은 통신 프로토콜을 직접 모델링하여 에이전트 간 관계와 작업 관련 세계 정보를 함께 포착하는 학습 가능한 표현 공간을 구축합니다. 이러한 표현은 명시적인 메시지 전달의 단점(예: 의사 결정 속도 저하, 악의적인 공격에 대한 취약성, 대역폭 제약에 대한 민감성)을 피하면서 암묵적인 협업을 통해 완전히 분산된 실행을 유지합니다. 실제로, IWoL 표현은 각 에이전트에 대한 암묵적인 잠재 변수로, 통신을 위한 명시적인 메시지로도 사용될 수 있습니다. 4개의 MARL 벤치마크를 통해 IWoL의 두 가지 변형을 평가한 결과, IWoL이 팀 협업을 위한 간단하면서도 강력한 핵심 요소임을 확인했습니다. 또한, 기존 MARL 알고리즘과 결합하여 성능을 더욱 향상시킬 수 있음을 보여줍니다.