haebom
Sign In
Beyond Parameter Arithmetic: Sparse Complementary Fusion for Distribution-Aware Model Merging
Created by
Haebom
Category
Empty
์ ์
Weihong Lin, Lin Sun, Qilong Shi, Aomufei Yuan, Yuxuan Tian, Zhengyang Wang, Guangxiang Zhao, Xiangzheng Zhang, Tong Yang
๐ก ๊ฐ์
๋ณธ ์ฐ๊ตฌ๋ ๊ธฐ์กด ๊ฐ์ค์น ๊ณต๊ฐ ๊ธฐ๋ฐ ๋ชจ๋ธ ๋ณํฉ ๋ฐฉ์์ ๊ฐ์ญ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ํฌ์ํ๊ณ ๋ถํฌ๋ฅผ ๊ณ ๋ คํ ์ ๋ฐ์ดํธ๋ฅผ ํตํด ๊ธฐ๋ฅ์ ๊ฐ์ญ์ ์ ์ดํ๋ ์๋ก์ด ๋ชจ๋ธ ๋ณํฉ ํ๋ ์์ํฌ์ธ Sparse Complementary Fusion with reverse KL (SCF-RKL)์ ์ ์ํฉ๋๋ค. SCF-RKL์ ๋งค๊ฐ๋ณ์ ๊ณต๊ฐ์ ์ ํ์ฑ์ ๊ฐ์ ํ๋ ๋์ , ์ญ KL ๋ฐ์ฐ์ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ ๊ฐ์ ๊ธฐ๋ฅ์ ๋ฐ์ฐ์ ์ธก์ ํ๊ณ ์ํธ ๋ณด์์ ์ธ ๋งค๊ฐ๋ณ์๋ฅผ ์ ํ์ ์ผ๋ก ํตํฉํ์ฌ ์์ ์ ์ธ ํํ์ ๋ณด์กดํ๋ฉด์ ์๋ก์ด ๊ธฐ๋ฅ์ ํตํฉํฉ๋๋ค. ๋ค์ํ ๋ชจ๋ธ ๊ท๋ชจ์ ์ํคํ ์ฒ, ๊ทธ๋ฆฌ๊ณ ์ถ๋ก ๋ฐ ์ง์ ํ๋ ๋ชจ๋ธ์ ๊ฑธ์ณ ๊ด๋ฒ์ํ ์คํ์ ํตํด SCF-RKL์ด ๊ธฐ์กด ๋ชจ๋ธ ๋ณํฉ ๋ฐฉ๋ฒ๋ก ์ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๋ฉฐ, ์ผ๋ฐํ ์ฑ๋ฅ๊ณผ ์์ฑ ์์ ์ฑ์ ์ ์งํจ์ ์ ์ฆํ์ต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
๋งค๊ฐ๋ณ์ ๊ณต๊ฐ์ ์ ํ์ฑ์ ๋ํ ๊ฐ์ ์์ด, ๋ชจ๋ธ ๊ฐ์ ๊ธฐ๋ฅ์ ์ฐจ์ด๋ฅผ ์ง์ ์ธก์ ํ๊ณ ๋ณด์์ ์ธ ๋งค๊ฐ๋ณ์๋ฅผ ํฌ์ํ๊ฒ ํตํฉํ๋ ์๋ก์ด ๋ชจ๋ธ ๋ณํฉ ํจ๋ฌ๋ค์์ ์ ์ํฉ๋๋ค.
โข
๋ค์ํ ๊ท๋ชจ์ ์ข ๋ฅ์ ๋ชจ๋ธ, ๊ด๋ฒ์ํ ๋ฒค์น๋งํฌ์์ ๊ธฐ์กด ๋ฐฉ๋ฒ ๋๋น ์ฐ์ํ ์ฑ๋ฅ๊ณผ ์์ ์ฑ์ ๋ฌ์ฑํ์ฌ ๋ชจ๋ธ ๋ณํฉ ์ฐ๊ตฌ์ ๋ฐ์ ์ ๊ธฐ์ฌํฉ๋๋ค.
โข
์ ์๋ ๋ฐฉ๋ฒ๋ก ์ด ์ญ KL ๋ฐ์ฐ์ ์ฌ์ฉํ์ฌ ๊ธฐ๋ฅ์ ๋ฐ์ฐ์ ์ธก์ ํ๋ ๋งํผ, ๊ณ์ฐ ๋ณต์ก์ฑ ์ฆ๊ฐ ๊ฐ๋ฅ์ฑ์ด ์์ผ๋ฉฐ, ํน์ ์ ํ์ ๋ชจ๋ธ์ด๋ ์์ ์ ๋ํ ํจ๊ณผ์ฑ์ด ์ถ๊ฐ์ ์ผ๋ก ์ฐ๊ตฌ๋ ํ์๊ฐ ์์ต๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage