haebom
Sign In
SpaceMoE: Realizing Distributed Mixture-of-Experts Inference over Space Networks
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Zhanwei Wang, Huiling Yang, Min Sheng, Khaled B. Letaief, Kaibin Huang
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ์์ฑ ๋คํธ์ํฌ์์ ์๋์ง ์ง์ฝ์ ์ธ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ํจ์จ์ ์ธ ๋ถ์ฐ ์ถ๋ก ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ SpaceMoE ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค. ์ ์๋ ๋ ๋จ๊ณ์ ๋ฐฐ์น ์ ๋ต(๋ ์ด์ด ๋ฐฐ์น ๋ฐ ๋ ์ด์ด ๋ด ์ ๋ฌธ๊ฐ ๋ฐฐ์น)์ ์์ฑ ๋คํธ์ํฌ์ ์ ํ๋ ์์์ ๊ณ ๋ คํ์ฌ ๋ชจ๋ธ ์ํคํ ์ฒ์ ๋คํธ์ํฌ ํ ํด๋ก์ง๋ฅผ ํตํฉํ์ฌ ์ ์ง์ฐ ํ ํฐ ์์ฑ์ ๋ณด์ฅํ๋ค. ์ฒ ๊ฐ์ ์์ฑ์ผ๋ก ๊ตฌ์ฑ๋ ํ๊ฒฝ์์ ์คํํ ๊ฒฐ๊ณผ, SpaceMoE๋ ๊ธฐ์กด ๋ฐฉ์ ๋๋น ์ต์ 3๋ฐฐ์ ์ง์ฐ ์๊ฐ ๊ฐ์๋ฅผ ๋ฌ์ฑํ๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
์์ฑ ๋คํธ์ํฌ ํ๊ฒฝ์์ LLM, ํนํ Mixture-of-Experts (MoE) ๋ชจ๋ธ์ ๋ถ์ฐ ์ถ๋ก ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ์๋ก์ด ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๋ค.
โข
๋ ์ด์ด ๋ฐฐ์น์ ์ ๋ฌธ๊ฐ ๋ฐฐ์น์ ๋ ๋จ๊ณ ์ ๋ต์ ํตํด ์์ฑ์ ์ปดํจํ ๋ฐ ํต์ ์์ ์ ์ฝ์ ๊ทน๋ณตํ๊ณ ์ง์ฐ ์๊ฐ์ ํจ๊ณผ์ ์ผ๋ก ๊ฐ์์์ผฐ๋ค.
โข
์์ฃผ ํ์ฑํ๋๋ ์ ๋ฌธ๊ฐ๋ฅผ ๋ฎ์ ์ง์ฐ ์๊ฐ ๊ฒฝ๋ก์์ ์์ฑ์ ๋ฐฐ์นํ๋ ์ง๊ด์ ์ธ ์๋ฆฌ๋ฅผ ๋์ถํ๋ค.
โข
์ค์ ์์ฑ ํ๊ฒฝ์์์ ์ฑ๋ฅ์ ์ ์ฆํ์ง๋ง, ๋ค์ํ LLM ์ํคํ ์ฒ ๋ฐ ์์ฑ ๋คํธ์ํฌ ๊ตฌ์ฑ์ ๋ํ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ ์ถ๊ฐ ์ฐ๊ตฌ๊ฐ ํ์ํ๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage