본 논문은 대규모 언어 모델(LLM) 통합 애플리케이션에서 프롬프트 주입 공격과 같은 보안 위협을 해결하기 위한 새로운 방법을 제시합니다. 기존의 최선을 다하는 방식의 공격 탐지 방식과 달리, 사용자 프롬프트에 암호화된 프롬프트(Encrypted Prompt)를 추가하여 현재 권한을 포함하는 방법을 제안합니다. LLM이 생성한 모든 작업(API 호출 등)을 실행하기 전에 이러한 권한을 검증하여 권한이 부족하면 LLM의 작업을 실행하지 않음으로써 안전성을 보장합니다. 이 방법은 LLM이 현재 권한 범위 내의 작업만 진행되도록 보장합니다. 적대적 프롬프트가 LLM을 오도하는 시나리오에서도 암호화된 프롬프트의 권한을 검증하여 무단 작업이 실행되지 않도록 합니다. 따라서 LLM이 유해한 작업을 생성하도록 유발하는 프롬프트 주입 공격과 같은 위협을 효과적으로 완화할 수 있습니다.