haebom
Sign In
Free(): Learning to Forget in Malloc-Only Reasoning Models
Created by
Haebom
Category
Empty
์ ์
Yilun Zheng, Dongyang Ma, Tian Liang, Jiahao Xu, Xinting Huang, Lijie Chen, Haitao Mi, Yan Wang
๐ก ๊ฐ์
๋ณธ ์ฐ๊ตฌ๋ ์ถ๋ก ๋ชจ๋ธ์ด ๋ถํ์ํ ์ ๋ณด๋ฅผ ๊ณ์ ์ถ์ ํ์ฌ ์ฑ๋ฅ ์ ํ๋ฅผ ์ผ์ผํค๋ "malloc-only" ์ํคํ ์ฒ์ ํ๊ณ๋ฅผ ์ง์ ํฉ๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ๋ณธ ๋ ผ๋ฌธ์ LoRA ์ด๋ํฐ ๊ธฐ๋ฐ์ Free-Module์ ๋์ ํ์ฌ ๋ชจ๋ธ์ด ์ค์ค๋ก ์ค๋๋ ์ ๋ณด๋ฅผ ์ ๊ฑฐํ๋ "Free()LM"์ ์ ์ํฉ๋๋ค. Free()LM์ ์ถ๋ก ๊ณผ ์ ๋ณด ์ ์ ๋ชจ๋๋ฅผ ๋ฐ๋ณตํ๋ฉฐ ๋งฅ๋ฝ ์ ๋ณด๋ฅผ ๋์ ์ผ๋ก ๊ด๋ฆฌํ์ฌ ์ผ๊ด๋ ์ฑ๋ฅ ํฅ์์ ๋ฌ์ฑํ์ต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
๊ธฐ์กด LLM์ ์ ๋ณด ์ถ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ์๋ก์ด ์๊ธฐ ๋ง๊ฐ(self-forgetting) ๋ฅ๋ ฅ ๋์
โข
์ฅ๊ธฐ ์ถ๋ก ๊ณผ์ ์์ ์ฌ๊ฐํ ์ฑ๋ฅ ์ ํ๋ฅผ ๊ฒช๋ ๊ธฐ์กด ๋ชจ๋ธ ๋๋น ํ๊ธฐ์ ์ธ ์ฑ๋ฅ ํ๋ณต
โข
๋ชจ๋ธ ๊ท๋ชจ์ ๋ฐ๋ฅธ ์ผ๊ด๋ ์ฑ๋ฅ ๊ฐ์ ๋ฐ ์๋ก์ด SOTA ๋ฌ์ฑ
โข
Free-Module์ ํจ์จ์ ์ธ ์ ๋ณด ์๋ณ ๋ฐ ์ ๊ฑฐ๋ฅผ ์ํ ์ถ๊ฐ ์ฐ๊ตฌ ํ์
โข
๋ง๊ฐ ๋ฉ์ปค๋์ฆ์ด ๋ชจ๋ธ์ ์ฐฝ์์ฑ์ด๋ ์๋ก์ด ์ ๋ณด ํ์ต์ ๋ฏธ์น๋ ์ํฅ ๋ถ์ ํ์
PDF ๋ณด๊ธฐ
Made with Slashpage