Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

QueryIPI: Query-agnostic Indirect Prompt Injection on Coding Agents

Created by
  • Haebom

저자

Yuchong Xie, Zesen Liu, Mingyu Luo, Zhixiang Zhang, Kaikai Zhang, Zongjie Li, Ping Chen, Shuai Wang, Dongdong She

개요

본 논문은 IDE에 통합된 최신 코딩 에이전트의 공격 표면을 분석하고, 쿼리 의존적인 기존 IPI 공격의 한계를 지적합니다. 쿼리 독립적인 IPI 공격인 QueryIPI를 제안하며, 에이전트의 내부 프롬프트 유출을 활용하여 악성 도구 설명을 반복적으로 개선합니다. 5개의 시뮬레이션된 에이전트에 대한 실험에서 최대 87%의 성공률을 달성했으며, 생성된 악성 설명이 실제 시스템으로 전이될 수 있음을 보여줍니다.

시사점, 한계점

시사점:
QueryIPI는 쿼리 독립적인 IPI 공격 기법을 제시하여, 기존 공격의 한계를 극복했습니다.
에이전트 내부 프롬프트 유출을 활용하여 악성 공격의 성공률을 높였습니다.
시뮬레이션 및 실제 환경에서의 실험을 통해 실질적인 보안 위협을 입증했습니다.
한계점:
내부 프롬프트 유출이 전제 조건으로, 모든 환경에 적용하기 어려울 수 있습니다.
특정 에이전트 환경에 대한 의존성을 추가적으로 분석할 필요가 있습니다.
방어 기법에 대한 연구가 미흡합니다.
👍