Sign In

PACZero: PAC-Private Fine-Tuning of Language Models via Sign Quantization

์ž‘์„ฑ์ž
  • Haebom
์นดํ…Œ๊ณ ๋ฆฌ
Empty

์ €์ž

Murat Bilgehan Ertan, Xiaochen Zhu, Phuong Ha Nguyen, Marten van Dijk, Srinivas Devadas

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ์—ฐ๊ตฌ๋Š” ์–ธ์–ด ๋ชจ๋ธ์˜ ๋ฏธ์„ธ ์กฐ์ • ๊ณผ์ •์—์„œ PAC(Probably Approximately Correct) ๊ฐœ์ธ ์ •๋ณด ๋ณดํ˜ธ๋ฅผ ์ œ๊ณตํ•˜๋Š” PACZero๋ผ๋Š” ์ƒˆ๋กœ์šด ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. PACZero๋Š” ์ œ๋กœ์Šค-์˜ค๋”(zeroth-order) ๋ฉ”์ปค๋‹ˆ์ฆ˜๊ณผ ๋ถ€ํ˜ธ ์–‘์žํ™”(sign quantization)๋ฅผ ํ™œ์šฉํ•˜์—ฌ, ๋ชจ๋ธ์˜ ์‹ค์ œ ํ•™์Šต ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ๋ฉค๋ฒ„์‹ญ ์ถ”๋ก  ๊ณต๊ฒฉ(MIA) ์„ฑ๊ณต๋ฅ ์„ ๋ฌด์ž‘์œ„ ์ˆ˜์ค€์œผ๋กœ ์ œํ•œํ•˜๋ฉด์„œ๋„ ์œ ์šฉํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด $\varepsilon=0$์— ๊ฐ€๊นŒ์šด DP(Differential Privacy) ์ˆ˜์ค€์— ์ƒ์‘ํ•˜๋Š” ๊ฐ•๋ ฅํ•œ ๊ฐœ์ธ ์ •๋ณด ๋ณดํ˜ธ๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, ๊ธฐ์กด ๋ฐฉ๋ฒ•์œผ๋กœ๋Š” ๋‹ฌ์„ฑํ•˜๊ธฐ ์–ด๋ ค์šด ๊ณ ์œ ์˜ ์œ ํ‹ธ๋ฆฌํ‹ฐ๋ฅผ ํ™•๋ณดํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
๊ฐ•๋ ฅํ•œ ๊ฐœ์ธ ์ •๋ณด ๋ณดํ˜ธ: PACZero๋Š” ๋ฉค๋ฒ„์‹ญ ์ถ”๋ก  ๊ณต๊ฒฉ์— ๋Œ€ํ•ด ๋งค์šฐ ๊ฐ•๋ ฅํ•œ ์ €ํ•ญ์„ฑ์„ ์ œ๊ณตํ•˜๋ฉฐ, ์ด๋Š” ๊ธฐ์กด DP ํ”„๋ ˆ์ž„์›Œํฌ์—์„œ $\varepsilon=0$์— ์ƒ์‘ํ•˜๋Š” ์ˆ˜์ค€์ž…๋‹ˆ๋‹ค.
โ€ข
์‹ค์šฉ์ ์ธ ์œ ํ‹ธ๋ฆฌํ‹ฐ ํ™•๋ณด: ๊ฐ•๋ ฅํ•œ ๊ฐœ์ธ ์ •๋ณด ๋ณดํ˜ธ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ , ์ œ์•ˆ๋œ ๋ฐฉ๋ฒ•(ํŠนํžˆ PACZero-ZPL)์€ SST-2 ๋ฐ SQuAD ๋ฐ์ดํ„ฐ์…‹์—์„œ ๋น„๊ณต๊ฐœ(non-private) baseline ๋Œ€๋น„ ํฌ๊ฒŒ ๋–จ์–ด์ง€์ง€ ์•Š๋Š” ์‹ค์šฉ์ ์ธ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
โ€ข
๋ถ€ํ˜ธ ์–‘์žํ™”์˜ ํšจ์šฉ์„ฑ: ์„œ๋ธŒ์…‹ ํ•ฉ์‚ฐ ์ œ๋กœ์Šค-์˜ค๋” ๊ทธ๋ž˜๋””์–ธํŠธ์˜ ๋ถ€ํ˜ธ ์–‘์žํ™”๋ฅผ ํ†ตํ•ด ๋ฐœ์ƒํ•˜๋Š” ๋นˆ๋ฒˆํ•œ "์ผ์น˜" ๋‹จ๊ณ„์—์„œ ์ •๋ณด ์œ ์ถœ์„ ํšจ๊ณผ์ ์œผ๋กœ ์ตœ์†Œํ™”ํ•˜๋Š” ํ•ต์‹ฌ ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
โ€ข
ํ•œ๊ณ„์ /ํ–ฅํ›„ ๊ณผ์ œ: PACZero-MI์˜ ๊ฒฝ์šฐ ์ด์ง„ ๊ณต๊ฐœ์— ๋Œ€ํ•œ ์ •ํ™•ํ•œ ๋ณด์ •, PACZero-ZPL์˜ ๊ฒฝ์šฐ ๋ถˆ์ผ์น˜ ๋‹จ๊ณ„์—์„œ์˜ ๊ท ๋“ฑ ๋ถ„ํฌ ๋™์ „ ๋˜์ง€๊ธฐ ๋“ฑ ์ผ๋ถ€ ๊ตฌํ˜„ ๋””ํ…Œ์ผ์ด ์ถ”๊ฐ€์ ์ธ ์—ฐ๊ตฌ ๋˜๋Š” ์ตœ์ ํ™”๋ฅผ ํ•„์š”๋กœ ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ๋” ๋ณต์žกํ•˜๊ฑฐ๋‚˜ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์—์„œ์˜ ์„ฑ๋Šฅ ๊ฒ€์ฆ ๋ฐ ๊ฐœ์ธ ์ •๋ณด ๋ณดํ˜ธ-์œ ํ‹ธ๋ฆฌํ‹ฐ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„์— ๋Œ€ํ•œ ์ถ”๊ฐ€์ ์ธ ํƒ๊ตฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
๐Ÿ‘