๋ณธ ๋
ผ๋ฌธ์ Mixture-of-Experts (MoE) ๋ฉํฐ๋ชจ๋ฌ ๋ํ ์ธ์ด ๋ชจ๋ธ (MoE MLLMs)์ ์ถ๋ก ํจ์จ์ฑ ๋ณ๋ชฉ ํ์, ํนํ Expert Parallelism (EP)์์์ '์คํธ๋๊ธ๋ฌ ํจ๊ณผ' ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด MACS (Modality-Aware Capacity Scaling)๋ผ๋ ์๋ก์ด ํ๋ จ ์๋(training-free) ์ถ๋ก ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค. MACS๋ ์ ๋ณด์ ์ด์ง์ฑ๊ณผ ๋ชจ๋ฌ๋ฆฌํฐ์ ๋์ ์ธ ๋ณํ๋ฅผ ๊ณ ๋ คํ์ฌ, ์๊ฐ ํ ํฐ์ ์๋ฏธ์ ๊ฐ์น๋ฅผ ์ ๋ํํ๊ณ ์
๋ ฅ์ ๋ฐ๋ผ ์ ๋ฌธ๊ฐ ์์์ ๋์ ์ผ๋ก ํ ๋นํจ์ผ๋ก์จ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ก ์ ํ๊ณ๋ฅผ ๊ทน๋ณตํฉ๋๋ค. ์คํ ๊ฒฐ๊ณผ, MACS๋ ๋ค์ํ ๋ฉํฐ๋ชจ๋ฌ ๋ฒค์น๋งํฌ์์ ๊ธฐ์กด ๋ฐฉ๋ฒ ๋๋น ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ฌ MoE MLLM์ ํจ์จ์ ์ธ EP ์ถ๋ก ๋ฐฐํฌ๋ฅผ ์ํ ์๋กญ๊ณ ๊ฐ๋ ฅํ ์๋ฃจ์
์ ์ ์ํฉ๋๋ค.