haebom
Sign In
POP: Online Structural Pruning Enables Efficient Inference of Large Foundation Models
Created by
Haebom
Category
Empty
์ ์
Yi Chen, Wonjin Shin, Shuhong Liu, Tho Mai, Jeongmo Lee, Chuanbo Hua, Kun Wang, Jun Liu, Joo-Young Kim
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ๋๊ท๋ชจ ๊ธฐ์ด ๋ชจ๋ธ(LFMs)์ ํจ์จ์ ์ธ ์ถ๋ก ์ ์ํด ๊ตฌ์กฐ์ ๊ฐ์ง์น๊ธฐ(structural pruning)๋ฅผ ์ ์ํฉ๋๋ค. ๊ธฐ์กด์ ๊ฐ์ง์น๊ธฐ ๋ฐฉ๋ฒ์ด ์ถ๋ก ์ ๊ณ ์ ๋ ๊ฒฐ์ ์ ๋ด๋ฆฌ๋ ๋ฐ๋ฉด, ์ ์ํ๋ POP(Partition-guided Online Pruning)๋ ์ปจํ ์คํธ ์กฐ๊ฑด์ ๋ฐ๋ผ ๋์ ์ผ๋ก ๊ฐ์ง์น๊ธฐ๋ฅผ ์ํํ์ฌ ๋ชจ๋ธ ์ฑ๋์ ์ ์ง, ํ๋ณด, ๊ฐ์ง์น๊ธฐ ์์ญ์ผ๋ก ๋ถํ ํ๊ณ , ๋์ฝ๋ฉ ๋จ๊ณ์์ ๋ฏธ์ธํ ๋ง์คํฌ๋ฅผ ์์ฑํ์ฌ ํจ์จ์ฑ์ ๋์ ๋๋ค. ์ด ๋ฐฉ๋ฒ์ ๋ณ๋์ ์ ์ฒ๋ฆฌ, ์ฌํ์ต, ์์ธก๊ธฐ ํ์ต ์์ด๋ ๋ค์ํ LFM์์ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ณด๋ค ์ฐ์ํ ์ ํ๋์ ๋ฎ์ ์ฐ์ฐ ์ค๋ฒํค๋๋ฅผ ๋ฌ์ฑํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
๊ธฐ์กด์ ๊ณ ์ ๋ ๊ตฌ์กฐ์ ๊ฐ์ง์น๊ธฐ ๋ฐฉ์์์ ๋ฒ์ด๋, autoregressive ํ ํฐ ์์ฑ ๊ณผ์ ์์ ๋ฐ์ํ๋ ํฌ์์ฑ ํจํด์ ํ์ฉํ๋ ๋์ ๊ฐ์ง์น๊ธฐ ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค.
โข
์ ์ ์ฐ์ฐ ์ค๋ฒํค๋๋ก ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ, Mixture-of-Experts ๋ชจ๋ธ, Vision-Language ๋ชจ๋ธ ๋ฑ ๋ค์ํ ์ข ๋ฅ์ ๊ธฐ์ด ๋ชจ๋ธ์ ์ ์ฉ ๊ฐ๋ฅํ๋ฉฐ, ์ฑ๋ฅ ํฅ์์ ์ ์ฆํฉ๋๋ค.
โข
๋ณธ ์ฐ๊ตฌ๋ 'plug-and-play' ๋ฐฉ์์ ๊ฒฝ๋ ๊ฐ์ง์น๊ธฐ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ง๋ง, ๋ฏธ์ธํ ๋ง์คํฌ ์์ฑ ๊ณผ์ ์์์ ์ต์ ํ ๋ฐ ๋ค์ํ ๋ชจ๋ธ ๊ตฌ์กฐ์ ๋ํ ์ผ๋ฐํ ์ฑ๋ฅ์ ๋ํ ์ถ๊ฐ์ ์ธ ์ฐ๊ตฌ๊ฐ ํ์ํ ์ ์์ต๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage