본 논문은 Markov decision process(MDP) 내의 상태 유사성을 계산하는 강력한 도구인 bisimulation metric (BSM)을 여러 MDP 시나리오, 특히 policy transfer에 적용하는 데 초점을 맞추고 있다. 기존 연구의 한계를 극복하기 위해, 본 연구는 두 MDP 간의 일반화된 bisimulation metric (GBSM)을 공식적으로 정의하고, GBSM의 수학적 특성을 엄밀하게 증명한다. GBSM의 대칭성, MDP 간 삼각 부등식, 동일 상태 공간에서의 거리 제한 등 세 가지 기본 속성을 통해 policy transfer, 상태 집약, 샘플링 기반 추정에 대한 이론적 분석을 수행하고, 기존 BSM보다 엄격한 경계를 얻는다. 또한, GBSM은 추정을 위한 닫힌 형식의 샘플 복잡도를 제공하며, 수치적 결과를 통해 GBSM의 효율성을 검증한다.