강화 학습(RL) 시스템은 다양한 분야에서 뛰어난 성과를 거두었지만, 적대적 공격에 취약하다. 특히, 고차원 이미지 입력을 사용하는 비전 기반 환경에서 작은 조작만으로도 에이전트의 행동을 오도할 수 있다. 이에 따라 다양한 방어 기법이 제안되었지만, 기존 방어 기법의 효과는 $l_p$ 노름 제약 공격의 근본적인 약점, 즉 비교적 큰 섭동 예산 하에서도 이미지 입력의 의미를 거의 변경하지 못한다는 점에 기인한다. 본 연구에서는 이러한 한계를 극복하기 위해 정책에 독립적인 확산 기반 상태 섭동 공격인 SHIFT를 제안한다. SHIFT는 현실적이고 기록 정렬된 상태를 유지하면서, 실제 상태와 의미론적으로 다른 섭동된 상태를 생성할 수 있다. 평가 결과, SHIFT는 가장 정교한 방어 기법을 포함하여 기존의 방어 기법을 효과적으로 무너뜨리며, 기존 공격보다 훨씬 뛰어나고 지각적으로 더 은밀하다는 것을 보여주었다.