본 논문은 기후 정책 개발 과정에서의 심각한 불확실성, 복잡한 시스템 역학, 그리고 상충하는 이해관계자들의 이익 문제를 해결하기 위해, 기후 시뮬레이션에 다중 에이전트 강화 학습(MARL)을 통합하는 프레임워크를 제안한다. 기존의 기후 시뮬레이션이 정책 평가에 주로 사용되는 것과 달리, 본 연구는 정책 경로를 최적화하는 데 MARL을 활용하여 정책 합성에 직접적으로 기여하고자 한다. 하지만, 보상 함수 정의, 에이전트 및 상태 공간 증가에 따른 확장성 문제, 연계 시스템 간의 불확실성 전파, 그리고 해결책의 타당성 검증 등 MARL 적용 과정에서 발생하는 여러 과제들을 제시하며, MARL 결과의 해석성 및 정책 결정자를 위한 유용성 확보에 대한 어려움 또한 논의한다. 이 프레임워크는 향후 연구를 위한 중요한 한계점과 방향을 제시하며 더욱 정교한 기후 정책 탐색의 기반을 제공한다.