본 논문은 대규모 언어 모델(LLM) 기반 로봇 시스템의 보안 취약성을 조사한다. LLM이 로봇 명령을 실행 가능한 정책으로 변환하는 과정에서, LLM의 감옥 탈출(jailbreak) 공격에 대한 취약성이 디지털 영역에서 물리적 영역으로의 심각한 보안 위험을 초래할 수 있다는 점을 지적한다. 연구는 기존 LLM 감옥 탈출 공격의 로봇 시스템 적용 가능성을 조사하고, 새로운 공격 기법인 POEX(POlicy EXecutable)를 제안한다. POEX는 은닉층 기울기 최적화와 다중 에이전트 평가자를 사용하여 실행 가능한 유해 정책을 유도하고, 실제 로봇 시스템 및 시뮬레이션을 통해 효과를 검증한다. 마지막으로, 감옥 탈출 공격을 완화하기 위한 프롬프트 기반 및 모델 기반 방어 기법을 제안한다.