본 논문은 다중 에이전트 강화 학습(MARL)에서 사회적 딜레마 환경을 효율적으로 평가하기 위한 새로운 프레임워크인 SocialJax를 제안합니다. 기존의 Melting Pot 프레임워크는 뛰어난 평가 프로토콜을 제공하지만, 높은 계산 자원을 필요로 한다는 한계가 있습니다. SocialJax는 JAX 라이브러리를 활용하여 GPU 및 TPU에서의 연산 효율을 크게 향상시켰으며, Melting Pot의 RLlib 기준선 대비 50배의 실시간 성능 향상을 달성했습니다. 또한, Schelling diagrams를 이용하여 사회적 딜레마 환경의 특성을 검증하고, 기준 알고리즘의 효과성을 SocialJax 환경 내에서 검증했습니다.