AI 개발은 서로 다른 정보, 권한 및 도구를 가진 독립적으로 개발된 에이전트로 구성된 에이전트 기반 시스템에 대한 의존도를 높일 것으로 예상된다. 이러한 시스템의 성공은 부분적인 관찰 환경에서도 이질적인 에이전트 간의 효과적인 협업에 달려 있다. 본 논문에서는 협업 능력을 격리하고, 문제 복잡성을 조절하며, 확장 가능한 자동 채점을 가능하게 하고, 출력 형식 제약 조건을 부과하지 않는 협업 미로 해결 벤치마크를 제안한다. 이를 사용하여 32개의 주요 오픈 소스 및 클로즈 소스 모델을 단독, 동질 및 이질 페어링에서 평가했다.