Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Attack the Messages, Not the Agents: A Multi-round Adaptive Stealthy Tampering Framework for LLM-MAS

Created by
  • Haebom

저자

Bingyu Yan, Ziyi Zhou, Xiaoming Zhang, Chaozhuo Li, Ruilin Zeng, Yirui Qi, Tianbo Wang, Litian Zhang

개요

본 논문은 대규모 언어 모델 기반 다중 에이전트 시스템(LLM-MAS)의 통신 취약성을 악용하는 새로운 공격 프레임워크인 MAST를 제안합니다. MAST는 몬테카를로 트리 탐색과 직접 선호도 최적화를 통합하여 적응적으로 효과적인 다단계 조작 전략을 생성하는 공격 정책 모델을 훈련합니다. 또한, 은밀성을 유지하기 위해 조작 과정에서 이중 의미 및 임베딩 유사성 제약 조건을 부과합니다. 다양한 작업, 통신 아키텍처 및 LLM에 대한 포괄적인 실험을 통해 MAST가 기준선과 비교하여 은밀성을 크게 향상시키면서 일관되게 높은 공격 성공률을 달성함을 보여줍니다.

시사점, 한계점

시사점:
LLM-MAS의 통신 취약성을 효과적으로 악용하는 새로운 공격 기법 MAST를 제시.
기존 공격 방식보다 높은 성공률과 은밀성을 달성.
다양한 환경에서의 적응성을 보여줌.
LLM-MAS의 보안 강화 필요성을 강조.
한계점:
MAST의 효과는 특정 LLM과 통신 아키텍처에 의존할 수 있음.
실제 환경에서의 일반화 가능성에 대한 추가 연구 필요.
더욱 정교한 방어 메커니즘에 대한 대응 방안 연구 필요.
👍