본 논문은 부분 관찰 환경에서 다중 에이전트 시스템의 효과적인 의사 결정을 위한 강력한 조정을 탐구한다. 특히, 통신 프로토콜을 직접 엔지니어링할 것인지, 아니면 종단간 학습할 것인지에 대한 질문을 다룬다. 협력적인 작업 할당 문제에 대해 두 가지 통신 전략을 비교한다. 첫 번째는 LDC(Learned Direct Communication)로, 에이전트가 메시지와 액션을 동시에 생성하는 종단간 학습 방식이다. 두 번째는 ITGM(Imagined Trajectory Generation Module)이라는 콤팩트한 학습된 세계 모델을 사용하여 미래 상태를 시뮬레이션하고, 이를 요약하여 통신하는 의도 통신 방식이다. 그리드 월드 환경에서 목표 지향 상호 작용에 대한 실험을 통해, 단순한 환경에서는 LDC가 가능하지만, 복잡성이 증가함에 따라 세계 모델 기반 방식이 더 우수한 성능, 샘플 효율성 및 확장성을 보임을 확인했다.