haebom
Sign In
ZeroUnlearn: Few-Shot Knowledge Unlearning in Large Language Models
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Yujie Lin, Chengyi Yang, Zhishang Xiang, Yiping Song, Jinsong Su
๐ก ๊ฐ์
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ์น ๋ฐ์ดํฐ ํ์ต ๊ณผ์ ์์ ๋ฏผ๊ฐํ ์ ๋ณด๋ฅผ ๋ด์ฌํ๊ฒ ๋์ด ํ๋ผ์ด๋ฒ์ ๋ฐ ์์ ๋ฌธ์ ๋ฅผ ์ผ๊ธฐํฉ๋๋ค. ๋ณธ ๋ ผ๋ฌธ์ ๊ธฐ์กด์ ๋นํจ์จ์ ์ด๊ฑฐ๋ ๊ด๋ จ ์ง์์ ์์์ํค๋ ์ฌํ์ต/ํ์ธํ๋ ๋ฐฉ์์ ๊ธฐ๊ณ์ ํ์ต ์ ๊ฑฐ(unlearning) ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ๋ชจ๋ธ ํธ์ง์ ํตํ ์ง์ ์ฌ๋งคํ ๋ฌธ์ ๋ก ์ฌ์ ์ํฉ๋๋ค. ์ด๋ฅผ ์ํด ์๋์ ๋ฐ์ดํฐ๋ง์ผ๋ก ๋ฏผ๊ฐํ ์ ๋ ฅ ์ ๋ณด๋ฅผ ์ค๋ฆฝ์ ์ธ ๋ชฉํ ์ํ๋ก ๋งคํํ๊ณ ์๋ณธ ํํ์ ์ ๊ฑฐํ๋ ZeroUnlearn ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
ํจ์จ์ ์ธ ์๋ ๋ฐ์ดํฐ ํ์ต ์ ๊ฑฐ:
ZeroUnlearn์ ์๋์ ๋ฐ์ดํฐ๋ง์ผ๋ก๋ ๋ฏผ๊ฐํ ์ง์์ ํจ๊ณผ์ ์ผ๋ก ์ ๊ฑฐํ๋ฉฐ, ๋ชจ๋ธ์ ์ ๋ฐ์ ์ธ ์ ์ฉ์ฑ์ ๋ณด์กดํฉ๋๋ค.
โข
์ ๋ฐํ ์ง์ ์ฌ๋งคํ:
ํํ ์ง๊ต์ฑ์ ๊ฐ์ ํ๋ ๊ณฑ์ ์ ํ๋ผ๋ฏธํฐ ์ ๋ฐ์ดํธ ๋ฐฉ์์ ํจ์จ์ ์ด๊ณ ๋ชฉํ ์งํฅ์ ์ธ ํ์ต ์ ๊ฑฐ๋ฅผ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค.
โข
๋ชจ๋ธ ํธ์ง ๊ธฐ๋ฐ ์ ๊ทผ ๋ฐฉ์:
๊ธฐ๊ณ์ ํ์ต ์ ๊ฑฐ๋ฅผ ๋ชจ๋ธ ํธ์ง ๋ฌธ์ ๋ก ์ฌ์ ์ํจ์ผ๋ก์จ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ก ์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๋ ์๋ก์ด ํจ๋ฌ๋ค์์ ์ ์ํฉ๋๋ค.
โข
๋ค์ค ์ํ ํ์ต ์ ๊ฑฐ ํ์ฅ:
๊ทธ๋๋์ธํธ ๊ธฐ๋ฐ ๋ณํ์ ํตํด ์ฌ๋ฌ ์ํ์ ๋ํ ํ์ต ์ ๊ฑฐ๊น์ง ํ์ฅ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage