본 논문은 설명 가능한 강화 학습(XRL)에서 모델 기반 심층 강화 학습 에이전트에 대한 설명을 생성하기 위해 월드 모델을 활용하는 기법을 제시합니다. 기존의 월드 모델은 행동에 따른 세계 변화를 예측하여 반실제 경로를 생성하지만, 사용자의 의도와 에이전트 행동 간의 불일치 원인을 설명하는 데는 부족합니다. 따라서 본 논문에서는 역 월드 모델을 추가하여, 에이전트가 특정 반실제 행동을 선호하기 위해 세계가 어떠해야 했는지를 예측합니다. 실험 결과, 세계가 어떠해야 했는지를 보여주는 설명이 사용자의 에이전트 정책 이해도를 크게 향상시킨다는 것을 보여줍니다. 나아가, 본 논문은 제시된 설명이 사용자가 환경 조작을 통해 에이전트 실행을 제어하는 방법을 학습하는 데 도움이 될 것이라고 가정합니다.