haebom
Sign In
Evaluation of Prompt Injection Defenses in Large Language Models
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Priyal Deep, Shane Emmons, Amy Fox, Kyle Bacon, Kelley McAllister, Peter Ortiz, Krisztian Flautner
๐ก ๊ฐ์
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM) ๊ธฐ๋ฐ ์ ํ๋ฆฌ์ผ์ด์ ์์ ์์คํ ํ๋กฌํํธ์ ํฌํจ๋ ๋ฏผ๊ฐํ ์ ๋ณด๊ฐ ๊ณต๊ฒฉ์์ ์ํด ๋ ธ์ถ๋ ์ ์๋ค๋ ๋ฌธ์ ๋ฅผ ์ ๊ธฐํฉ๋๋ค. ๋ณธ ์ฐ๊ตฌ๋ ์๋ฐฑ ๋ผ์ด๋์ ๊ฑธ์ณ ์ ๋ต์ ๋ฐ์ ์ํค๋ ์ ์ํ ๊ณต๊ฒฉ์๋ฅผ ๊ฐ๋ฐํ์ฌ 9๊ฐ์ง ๋ฐฉ์ด ์ค์ ์ 20,000ํ ์ด์์ ๊ณต๊ฒฉ์ผ๋ก ํ ์คํธํ์ต๋๋ค. ๋ชจ๋ธ ์์ฒด์ ๋ฐฉ์ด ๊ธฐ๋ฅ์ ๋งก๊ธด ๋ชจ๋ ๋ฐฉ์์ ๊ฒฐ๊ตญ ์คํจํ์ผ๋ฉฐ, ์ธ๋ถ์์ ๊ท์น ๊ธฐ๋ฐ์ผ๋ก ์๋ต์ ๊ฒ์ฆํ๋ ์ถ๋ ฅ ํํฐ๋ง๋ง์ด 15,000ํ ๊ณต๊ฒฉ ๋์ ๋จ ํ ๊ฑด์ ์ ๋ณด ์ ์ถ๋ ์์ด ์ฑ๊ณตํ์ต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
LLM ์์ฒด์ ๋ณด์ ๊ธฐ๋ฅ์ ์์กดํ๋ ๋ฐฉ์ด๋ ๊ถ๊ทน์ ์ผ๋ก ์ทจ์ฝํ๋ฉฐ, ์ธ๋ถ ์ ํ๋ฆฌ์ผ์ด์ ์ฝ๋์์ ๋ณด์ ๊ฒฝ๊ณ๋ฅผ ๋ช ํํ ์ค์ ํด์ผ ํฉ๋๋ค.
โข
์ฌ์ฉ์์๊ฒ ๋๋ฌํ๊ธฐ ์ ์ ์๋ต์ ๊ฒ์ฆํ๋ ํ๋์ฝ๋ฉ๋ ๊ท์น ๊ธฐ๋ฐ์ ์ถ๋ ฅ ํํฐ๋ง์ด ํ์ฌ ๊ฐ์ฅ ํจ๊ณผ์ ์ธ ๋ฐฉ์ด ์ ๋ต์์ ์ ์ฆํ์ต๋๋ค.
โข
Swept AI์ ๊ฐ์ ๋๊ตฌ๋ฅผ ํตํด ๊ฒ์ฆ๋๊ธฐ ์ ๊น์ง๋ ๋ฏผ๊ฐํ ์ ๋ณด๋ฅผ ์ฒ๋ฆฌํ๋ AI ์์คํ ์ ์ ๋ขฐํ ์ ์๋ ๋ด๋ถ ์ธ๋ ฅ์ผ๋ก ์ ๊ทผ์ ์ ํํด์ผ ํฉ๋๋ค.
โข
๋ณธ ์ฐ๊ตฌ๋ ๋จ์ผ ๊ณต๊ฒฉ์ ์๋ฎฌ๋ ์ด์ ๊ณผ 9๊ฐ์ง ๋ฐฉ์ด ์ค์ ์ ๊ตญํ๋์์ผ๋ฏ๋ก, ๋ ๋ค์ํ ๊ณต๊ฒฉ ์๋๋ฆฌ์ค์ ๋ฐฉ์ด ๋ฉ์ปค๋์ฆ์ ๋ํ ์ถ๊ฐ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage