PragLocker: Protecting Agent Intellectual Property in Untrusted Deployments via Non-Portable Prompts

์ž‘์„ฑ์ž
  • Haebom
์นดํ…Œ๊ณ ๋ฆฌ
๋น„์–ด ์žˆ์Œ

์ €์ž

Qinfeng Li, Yuntai Bao, Jianghui Hu, Wenqi Zhang, Jintao Chen, Huifeng Zhu, Yier Jin, Xuhong Zhang

๐Ÿ’ก ๊ฐœ์š”

์ด ๋…ผ๋ฌธ์€ ์‹ ๋ขฐํ•  ์ˆ˜ ์—†๋Š” ํ™˜๊ฒฝ์— ๋ฐฐํฌ๋  ๋•Œ LLM ์—์ด์ „ํŠธ์˜ ํ”„๋กฌํ”„ํŠธ ์ง€์  ์žฌ์‚ฐ์„ ๋ณดํ˜ธํ•˜๋Š” ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ๊ธฐ์กด ์†”๋ฃจ์…˜์ด ํ”„๋กฌํ”„ํŠธ์˜ ํ”„๋กœ์•กํ‹ฐ๋ธŒ์„ฑ, ๋Ÿฐํƒ€์ž„ ๋ณดํ˜ธ, ์‚ฌ์šฉ์„ฑ, ๋น„์ด์‹์„ฑ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜์ง€ ๋ชปํ•˜๋Š” ์ ์„ ์ง€์ ํ•˜๋ฉฐ, ํ”„๋กฌํ”„ํŠธ์˜ ์˜๋ฏธ๋ฅผ ์ฝ”๋“œ ์‹ฌ๋ณผ์— ๊ณ ์ •ํ•˜๊ณ  ๋ชฉํ‘œ ๋ชจ๋ธ ํ”ผ๋“œ๋ฐฑ์„ ํ†ตํ•ด ๋…ธ์ด์ฆˆ๋ฅผ ์ฃผ์ž…ํ•˜์—ฌ ํ•จ์ˆ˜๋ฅผ ๋ณด์กดํ•˜๋Š” ๋‚œ๋…ํ™”๋œ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ƒ์„ฑํ•˜๋Š” PragLocker๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์‹คํ—˜ ๊ฒฐ๊ณผ, PragLocker๋Š” LLM ๊ฐ„์˜ ํ”„๋กฌํ”„ํŠธ ์ด์‹์„ฑ์„ ํฌ๊ฒŒ ์ค„์ด๊ณ  ๋ชฉํ‘œ ๋ชจ๋ธ์—์„œ์˜ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•˜๋ฉฐ ์ ์‘ํ˜• ๊ณต๊ฒฉ์— ๋Œ€ํ•œ ๊ฐ•๊ฑด์„ฑ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
LLM ์—์ด์ „ํŠธ์˜ ํ”„๋กฌํ”„ํŠธ ์ง€์  ์žฌ์‚ฐ์„ ์‹ ๋ขฐํ•  ์ˆ˜ ์—†๋Š” ๋ฐฐํฌ ํ™˜๊ฒฝ์—์„œ๋„ ํšจ๊ณผ์ ์œผ๋กœ ๋ณดํ˜ธํ•  ์ˆ˜ ์žˆ๋Š” ์ƒˆ๋กœ์šด ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
โ€ข
์ œ์•ˆ๋œ PragLocker๋Š” ํ”„๋กฌํ”„ํŠธ์˜ ๊ธฐ๋Šฅ์„ฑ์„ ์œ ์ง€ํ•˜๋ฉด์„œ๋„ ํƒ€์‚ฌ LLM์—์„œ์˜ ์‚ฌ์šฉ์„ ์–ด๋ ต๊ฒŒ ํ•˜์—ฌ ๊ฒฝ์ œ์  ์†์‹ค์„ ๋ฐฉ์ง€ํ•˜๋Š” ๋ฐ ๊ธฐ์—ฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
โ€ข
๋‹ค์–‘ํ•œ LLM ๋ฐ ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์— ๋Œ€ํ•œ ์‹คํ—˜์„ ํ†ตํ•ด ์ œ์•ˆ๋œ ๋ฐฉ๋ฒ•์˜ ์‹คํšจ์„ฑ๊ณผ ๊ฐ•๊ฑด์„ฑ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค.
โ€ข
์ ์‘ํ˜• ๊ณต๊ฒฉ์— ๋Œ€ํ•œ ์™„๋ฒฝํ•œ ๋ฐฉ์–ด ๋˜๋Š” ์žฅ๊ธฐ์ ์ธ ํ”„๋กฌํ”„ํŠธ ๋ณดํ˜ธ๋ฅผ ์œ„ํ•œ ์ถ”๊ฐ€์ ์ธ ์—ฐ๊ตฌ ๋ฐ ๊ฐœ์„ ์ด ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘