본 논문은 대규모 언어 모델(LLM)의 멀티턴(multi-turn) 공격에 대한 새로운 프레임워크인 PLAGUE를 제시합니다. PLAGUE는 라이프 롱 러닝 에이전트에서 영감을 얻어 멀티턴 공격을 Primer, Planner, Finisher의 세 단계로 나누어 체계적으로 설계합니다. PLAGUE를 사용하여 설계된 공격 에이전트는 최첨단 모델을 대상으로 높은 공격 성공률(ASR)을 달성했으며, 특히 안전성 측면에서 저항력이 강하다고 여겨지는 OpenAI의 o3 모델과 Claude의 Opus 4.1 모델에 대해서도 높은 ASR을 보였습니다.