Long context LLM은 프롬프트 주입 공격에 취약하며, 기존 방어 기법은 긴 컨텍스트 환경에서 제한적인 효과를 보임. 본 논문에서는 프롬프트 주입 공격을 방어하기 위해 PISanitizer를 제안하며, LLM이 응답을 생성하기 전에 잠재적인 주입 토큰을 찾아 정화한다. PISanitizer는 LLM의 어텐션 메커니즘을 활용하여, LLM의 instruction-following 행동을 유발하는 고 어텐션 토큰을 정화하는 방식으로 공격에 대응한다.