Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

AgentArmor: Enforcing Program Analysis on Agent Runtime Trace to Defend Against Prompt Injection

Created by
  • Haebom
Category
Empty

저자

Peiran Wang, Yang Liu, Yunfei Lu, Yifeng Cai, Hongbo Chen, Qingyou Yang, Jie Zhang, Jue Hong, Ye Wu

개요

LLM 에이전트는 자연어 추론과 외부 도구 실행을 결합하여 다양한 문제를 해결하는 강력한 새로운 패러다임을 제공하지만, 동적이고 투명하지 않은 동작은 특히 프롬프트 주입 공격의 경우 심각한 보안 위험을 초래합니다. 본 연구에서는 에이전트 런타임 트레이스를 분석 가능한 의미론을 가진 구조화된 프로그램으로 취급한다는 새로운 통찰력을 제안합니다. 따라서, 에이전트 트레이스를 그래프 기반 중간 표현(CFG, DFG, PDG 등)으로 변환하고, 형식 시스템을 통해 보안 정책을 시행하는 프로그램 분석 프레임워크인 AgentArmor를 제시합니다. AgentArmor는 그래프 생성기, 속성 레지스트리, 형식 시스템의 세 가지 주요 구성 요소로 구성됩니다. AgentArmor는 AgentDojo 벤치마크에서 평가되었으며, 공격 성공률(ASR)을 3%로 줄이고, 유틸리티 감소는 1%에 불과했습니다.

시사점, 한계점

시사점:
LLM 에이전트의 보안 문제를 해결하기 위한 새로운 접근 방식 제시 (프로그램 분석 기반).
AgentArmor 프레임워크를 통해 에이전트의 런타임 트레이스를 구조화된 프로그램으로 표현하고 분석 가능하게 함.
AgentDojo 벤치마크에서 높은 성능 (낮은 ASR, 작은 유틸리티 감소) 입증.
한계점:
논문 내용에 구체적인 한계점 언급 없음.
👍