haebom
Sign In
From Local to Global: Revisiting Structured Pruning Paradigms for Large Language Models
Created by
Haebom
Category
Empty
์ ์
Ziyan Wang, Enmao Diao, Qi Le, Pu Wang, Minwoo Lee, Shu-ping Yeh, Evgeny Stupachenko, Hao Feng, Li Yang
๐ก ๊ฐ์
์ด ๋ ผ๋ฌธ์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ํจ์จ์ ์ธ ๋ฐฐํฌ๋ฅผ ์ํ ๊ตฌ์กฐ์ ๊ฐ์ง์น๊ธฐ(structured pruning) ๊ธฐ๋ฒ์ ๊ฐ์ ํ๋ ๋ฐ ์ด์ ์ ๋ง์ถฅ๋๋ค. ๊ธฐ์กด์ ๊ตญ์์ (local) ๊ฐ์ง์น๊ธฐ ๋ฐฉ์์ด ์์ ๋ณ ์ฑ๋ฅ ํฅ์์ ํ๊ณ๋ฅผ ๋ณด์ด์, ๋ณธ ์ฐ๊ตฌ๋ ์ ์ญ์ (global) ๊ด์ ์์ ๊ฐ์ง์น๊ธฐ๋ฅผ ์ํํ๋ GISP(Global Iterative Structured Pruning) ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค. GISP๋ ์์ค ๊ธฐ๋ฐ ์ค์๋ ์ ์๋ฅผ ํ์ฉํ์ฌ ๋ฐ๋ณต์ ์ผ๋ก ๊ตฌ์กฐ๋ฅผ ์ ๊ฑฐํจ์ผ๋ก์จ, ์๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ ์งํ๋ฉด์๋ ๋ ๋์ ํฌ์์ฑ์ ๋ฌ์ฑํ๊ณ ํน์ ์์ ์ ๋ํ ์ฑ๋ฅ์ ํฅ์์ํต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
์์ ๋ง์ถคํ ๊ฐ์ง์น๊ธฐ์ ์ค์์ฑ
: ์ ์ญ์ ์ธ ์ค์๋ ์ธก์ ๊ณผ ๋ฐ๋ณต์ ์ธ ๊ฐ์ง์น๊ธฐ ํ๋ก์ธ์ค๋ฅผ ํตํด, ๋จ์ํ ์ผ๋ฐ์ ์ธ ์ฑ๋ฅ ์งํ(์: perplexity)๋ฅผ ์ ์งํ๋ ๊ฒ์ ๋์ด ํน์ ๋ค์ด์คํธ๋ฆผ ์์ ์ ๋ํ ์ฑ๋ฅ์ ํจ๊ณผ์ ์ผ๋ก ํฅ์์ํฌ ์ ์์์ ๋ณด์ฌ์ค๋๋ค.
โข
'ํ ๋ฒ ๊ฐ์ง์น๊ธฐ, ์ฌ๋ฌ ๋ฒ ๋ฐฐํฌ' ์ํฌํ๋ก์ฐ ์ง์
: ๋ฐ๋ณต์ ๊ฐ์ง์น๊ธฐ ๊ณผ์ ์์ ์์ฑ๋๋ ์ค์ฒฉ๋ ์๋ธ๋คํธ์ํฌ ๊ตฌ์กฐ๋ ๋ค์ํ ํฌ์์ฑ ์์ค์ ๋ง๋ ๋ชจ๋ธ์ ํจ์จ์ ์ผ๋ก ๊ด๋ฆฌํ๊ณ ๋ฐฐํฌํ ์ ์๋ ๊ฐ๋ฅ์ฑ์ ์ ์ํฉ๋๋ค.
โข
๊ฐ์ง์น๊ธฐ ์์ ๋ฐ ๋ณต์ก์ฑ
: ๋ณธ ์ฐ๊ตฌ๋ ํํ์ต(post-training) ๊ฐ์ง์น๊ธฐ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ์ง๋ง, ์ต์ ์ ๊ฐ์ง์น๊ธฐ ์ผ์ ์ด๋ ํน์ ์์ ์ ๋ฐ๋ฅธ ๊ฐ์ง์น๊ธฐ ๊ฐ๋ ์กฐ์ ์ ๋ํ ์ถ๊ฐ์ ์ธ ์ฐ๊ตฌ๊ฐ ํ์ํ ์ ์์ต๋๋ค. ๋ํ, ๋๊ท๋ชจ ๋ชจ๋ธ์ ๋ํ ๋ฐ๋ณต์ ์ธ ์ต์ ํ ๊ณผ์ ์์ฒด์ ๊ณ์ฐ ๋น์ฉ๋ ๊ณ ๋ คํด์ผ ํ ๋ถ๋ถ์ ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage