haebom
Sign In
Trojan Hippo: Weaponizing Agent Memory for Data Exfiltration
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Debeshee Das, Julien Piet, Darya Kaviani, Luca Beurer-Kellner, Florian Tram
er, David Wagner
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ LLM ์์ด์ ํธ์ ์ฅ๊ธฐ ๊ธฐ์ต ์์คํ ์ ์ ์ฉํ์ฌ ๋ฏผ๊ฐํ ๊ฐ์ธ ์ ๋ณด๋ฅผ ํ์ทจํ๋ ์๋ก์ด ๊ณต๊ฒฉ ๊ธฐ๋ฒ์ธ "ํธ๋ก์ด ๋ชฉ๋ง ํ๋ง(Trojan Hippo)"๋ฅผ ์ ์ํฉ๋๋ค. ์ด ๊ณต๊ฒฉ์ ๋จ ํ ๋ฒ์ ์ ๋ขฐํ ์ ์๋ ๋๊ตฌ ํธ์ถ์ ํตํด ์ ์ฑ ํ์ด๋ก๋๋ฅผ ์ ์ฌ์ฐ๊ณ , ์ฌ์ฉ์๊ฐ ๊ธ์ต, ๊ฑด๊ฐ ๋ฑ ๋ฏผ๊ฐํ ์ฃผ์ ๋ฅผ ๋ค๋ฃฐ ๋๋ง ํ์ฑํ๋์ด ์ ๋ณด๋ฅผ ๋นผ๋๋ฆฝ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
์๋ก์ด ์ํ ๋ชจ๋ธ ์ ์:
๊ธฐ์กด ์ฐ๊ตฌ๋ณด๋ค ํ์ค์ ์ธ ์ํ ๋ชจ๋ธ์์ ์๋ํ๋ ์๊ตฌ ๊ธฐ์ต ๊ณต๊ฒฉ์ ์ฒด๊ณ์ ์ผ๋ก ํ๊ฐํ ์ ์๋ ๊ธฐ๋ฐ์ ๋ง๋ จํ์ต๋๋ค.
โข
ํจ๊ณผ์ ์ธ ๊ณต๊ฒฉ ์์ฐ:
๋ค ๊ฐ์ง ๋ค๋ฅธ ๋ฉ๋ชจ๋ฆฌ ๋ฐฑ์๋์์ ํธ๋ก์ด ๋ชฉ๋ง ํ๋ง ๊ณต๊ฒฉ์ด OpenAI ๋ฐ Google์ ์ต์ ๋ชจ๋ธ์ ๋์์ผ๋ก 85-100%์ ๋์ ๊ณต๊ฒฉ ์ฑ๊ณต๋ฅ (ASR)์ ๋ฌ์ฑํจ์ ์ ์ฆํ์ต๋๋ค.
โข
๋ฐฉ์ด ๊ธฐ๋ฒ์ ํจ๊ณผ ๋ฐ ํ๊ณ:
๊ธฐ๋ณธ์ ์ธ ๋ณด์ ์๋ฆฌ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ๋ค ๊ฐ์ง ๋ฐฉ์ด ๊ธฐ๋ฒ์ด ๊ณต๊ฒฉ ์ฑ๊ณต๋ฅ ์ ํ์ ํ ๋ฎ์ถ์ง๋ง, ์์ ์๊ตฌ ์ฌํญ์ ๋ฐ๋ผ ์ ํธ๋ฆฌํฐ ๋น์ฉ์ด ํฌ๊ฒ ๋ฌ๋ผ์ ธ ์ค์ง์ ์ธ ๋ฐฐํฌ์ ์ด๋ ค์์ด ์์์ ๋ณด์ฌ์ค๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage