๋ณธ ๋
ผ๋ฌธ์ Mixture-of-Experts (MoE) ์์คํ
์์ GPU ๊ฐ ์ฑ๋ฅ ๋ถ๊ท ํ์ผ๋ก ์ธํ ๋ณ๋ชฉ ํ์์ ํด๊ฒฐํ๊ธฐ ์ํ ์ ๋ฌธ๊ฐ(expert) ํ ๋น ๊ธฐ๋ฒ์ธ GEM์ ์ ์ํ๋ค. GEM์ GPU์ ์ฑ๋ฅ ๋ณ๋์ฑ์ ๊ณ ๋ คํ์ฌ, ์์ฃผ ์ฌ์ฉ๋๋ ์ ๋ฌธ๊ฐ์ ๊ฐํ์ ์ผ๋ก ํจ๊ป ์ฌ์ฉ๋๋ ์ ๋ฌธ๊ฐ๋ฅผ ๋ถ์ฐ์ํค๊ณ ๋๋ฆฐ GPU์ ๋ฐฐ์น๋๋ ๊ฒ์ ๋ฐฉ์งํจ์ผ๋ก์จ ๋ ์ด์ด ์ฒ๋ฆฌ ์๋ฃ ์๊ฐ์ ๊ท ๋ฑํ๊ฒ ๋ง์ถ๋ค. ์ด๋ฅผ ํตํด ํ๊ท 7.9%, ์ต๋ 16.5%์ ์ข
๋จ ๊ฐ ์ง์ฐ ์๊ฐ ๊ฐ์๋ฅผ ๋ฌ์ฑํ๋ค.