haebom
λ‘κ·ΈμΈ
Hidden in Memory: Sleeper Memory Poisoning in LLM Agents
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
λΉμ΄ μμ
μ μ
Sidharth Pulipaka, Stanislau Hlebik, Leonidas Raghav, Sahar Abdelnabi, Vyas Raina, Ivaxi Sheth, Mario Fritz
π‘ κ°μ
λ³Έ λ Όλ¬Έμ LLM μμ΄μ νΈμ μ§μμ μΈ κΈ°μ΅ κΈ°λ₯μ΄ μλ‘μ΄ λ³΄μ μνμΈ "μ¬λ¦¬νΌ λ©λͺ¨λ¦¬ μ€λ " 곡격μ λ ΈμΆλ μ μμμ λ°νλλ€. 곡격μλ μΈλΆ λ¬Έλ§₯μ μ‘°μνμ¬ μμ΄μ νΈκ° μ¬μ©μλ‘λΆν° μλͺ»λ κΈ°μ΅μ μ μ₯νλλ‘ μ λνλ©°, μ΄λ‘ μΈν΄ ν₯ν λνμ μ μν₯μ λ―ΈμΉ μ μμ΅λλ€. μ€ν κ²°κ³Ό, GPT-5.5 λ° Kimi-K2.6 λͺ¨λΈμμ λμ λΉμ¨λ‘ μ€λ λ κΈ°μ΅μ΄ μ μ₯λμμΌλ©°, μ±κ³΅μ μΈ κ²μ μ 60-89%μ κ²½μ° μμ΄μ νΈμ νλμ 곡격μμ μλλλ‘ μ‘°μ’ ν μ μμμ΅λλ€.
π μμ¬μ λ° νκ³
β’
LLM μμ΄μ νΈμ μ§μμ μΈ κΈ°μ΅ κΈ°λ₯μ μ μ¬μ μΈ μ₯κΈ° 곡격 νλ©΄μ μ 곡νλ©°, μ΄λ κ°μΈν λ° μ°μμ±μ μν κΈ°λ₯μ΄ μμ€μ μΌλ‘ 보μ μ·¨μ½μ μ μΌκΈ°ν μ μμμ μμ¬ν©λλ€.
β’
μ¬λ¦¬νΌ λ©λͺ¨λ¦¬ μ€λ 곡격μ μ¦κ°μ μ΄μ§ μκ³ μ§μ°λμ΄ λ°μνλ―λ‘ νμ§ λ° λ°©μ΄κ° λ μ΄λ ΅κ³ , μ¬λ¬ μ°¨λ‘μ λνμ κ±Έμ³ μ§μμ μΈ μν₯μ λ―ΈμΉ μ μμ΅λλ€.
β’
λ³Έ μ°κ΅¬λ μ€λ λ κΈ°μ΅μ μ μ₯, κ²μ, κ·Έλ¦¬κ³ κΆκ·Ήμ μΌλ‘ μμ΄μ νΈ νλμ λ―ΈμΉλ μν₯κΉμ§ 곡격 νμ΄νλΌμΈ μ λ°μ νκ°νμμΌλ, μ€μ νκ²½μμμ 곡격 μ±κ³΅λ₯ λ° λ°©μ΄ λ©μ»€λμ¦μ λν μΆκ°μ μΈ μ¬μΈ΅ μ°κ΅¬κ° νμν©λλ€.
PDF 보기
Slashpageλ‘ μ μλ¨