Remembering More, Risking More: Longitudinal Safety Risks in Memory-Equipped LLM Agents

작성자

Haebom

카테고리

Empty

저자

Ahmad Al-Tawaha, Shangding Gu, Peizhi Niu, Ruoxi Jia, Ming Jin

💡 개요

기존 메모리 탑재 LLM 에이전트 안전성 평가는 단일 작업 내 안전성만 측정하지만, 실제 배포 환경에서는 오랜 기간 다양한 독립적인 작업을 수행하며 축적된 메모리가 후속 작업에 영향을 미칩니다. 본 논문은 이러한 시간적 맥락에서의 안전성 변화, 즉 '시간적 메모리 오염' 문제를 조명하고, 트리거-프로브 프로토콜을 통해 메모리 축적 길이에 따른 안전성 위험 증가 추세를 실험적으로 입증합니다.

🔑 시사점 및 한계

•

메모리 탑재 LLM 에이전트의 안전성은 단일 상태가 아닌 시간에 따라 변화하는 속성으로, 장기적인 관점에서의 평가가 필수적입니다.

•

메모리 축적은 LLM 에이전트의 안전성에 지속적으로 부정적인 영향을 미칠 수 있으며, 이는 단순한 콘텐츠 누적에 의한 것으로 나타났습니다.

•

메모리 오염으로 인한 위험은 생성 단계 이전의 검색 단계에서도 감지될 수 있어, 이를 활용한 진단 모니터링의 가능성을 제시합니다.

•

(한계점 또는 향후 과제) 본 연구에서 제시된 프로토콜과 결과는 특정 시나리오 및 메모리 아키텍처에 국한될 수 있으며, 더 다양한 환경 및 복잡한 메모리 구조에 대한 추가적인 연구가 필요합니다.

PDF 보기

Made with Slashpage