본 논문은 다수의 에이전트가 있는 강화학습(MARL)을 이용하여 로봇 관련 문제, 특히 다중 로봇 경로 탐색 문제를 해결하는 다양한 접근 방식(고전적 방법, 학습 기반 방법, 하이브리드 방법)을 비교 평가하기 위한 통합 프레임워크인 POGEMA를 제시한다. POGEMA는 빠른 학습 환경, 문제 인스턴스 생성기, 미리 정의된 문제 인스턴스 집합, 시각화 툴킷, 자동 평가 벤치마킹 툴을 포함하며, 성공률 및 경로 길이 등의 주요 평가 지표를 기반으로 다양한 도메인 관련 지표를 계산하는 평가 프로토콜을 정의하여 다양한 방법들의 공정한 비교를 가능하게 한다. 논문에서는 최첨단 MARL, 탐색 기반 및 하이브리드 방법들을 포함한 다양한 방법들의 비교 결과를 제시한다.