본 논문은 마르코프 의사결정 과정(MDP)에 대한 기존의 반사실적 추론 방법의 주요 한계점을 다룹니다. 기존 방법들은 반사실적 사건을 식별하기 위해 특정 인과 모델을 가정하지만, 관측 및 개입 분포와 일치하는 다양한 인과 모델이 존재하며, 각 모델은 서로 다른 반사실적 분포를 생성합니다. 따라서 특정 인과 모델을 고정하는 것은 반사실적 추론의 타당성과 유용성을 제한합니다. 본 논문은 모든 호환 가능한 인과 모델에 걸쳐 반사실적 전이 확률에 대한 엄격한 경계를 계산하는 새로운 비모수적 방법을 제안합니다. 기존 방법들이 MDP 크기에 따라 기하급수적으로 증가하는 변수를 가진 매우 큰 최적화 문제를 풀어야 하는 것과 달리, 본 논문의 방법은 이러한 경계에 대한 폐쇄형 표현식을 제공하여 비자명적인 MDP에 대해서도 계산을 매우 효율적이고 확장 가능하게 만듭니다. 이러한 구간 반사실적 MDP가 구성되면, 불확실한 구간 MDP 확률에 대해 최악의 경우 보상을 최적화하는 강력한 반사실적 정책을 식별합니다. 다양한 사례 연구를 통해 기존 방법보다 향상된 강건성을 보여줍니다.