本文提出了交互式世界潜变量(IWoL),这是一种新颖的表征学习框架,旨在促进多智能体强化学习(MARL)中的团队协作。由于多智能体交互以及局部观测导致的信息不完整,构建有效的团队协作表征极具挑战性。IWoL 直接建模通信协议,构建一个可学习的表征空间,用于捕捉智能体间关系和与任务相关的世界信息。这种表征避免了显式消息传递的弊端(例如,决策速度慢、易受恶意攻击以及对带宽限制的敏感性),同时通过隐式协作保持了完全分布式的执行。事实上,IWoL 表征作为每个智能体的隐式潜变量,也可以用作通信的显式消息。我们使用四个 MARL 基准测试评估了两种 IWoL 变体,表明 IWoL 是团队协作的一个简单而强大的核心。我们还证明了 IWoL 可以与现有的 MARL 算法结合使用,以进一步提升性能。