haebom
Sign In
Orders in Chaos: Enhancing Large-Scale MoE LLM Serving with Data Movement Forecasting
Created by
Haebom
Category
Empty
μ μ
Zhongkai Yu, Yue Guan, Zihao Yu, Chenyang Zhou, Zhengding Hu, Shuyi Pei, Yangwook Kang, Yufei Ding, Po-An Tsai
π‘ κ°μ
λ³Έ μ°κ΅¬λ λκ·λͺ¨ MoE (Mixture of Experts) LLM (Large Language Model)μ μλΉ κ³Όμ μμ λ°μνλ λ°μ΄ν° μ΄λ μ€λ²ν€λλ₯Ό ν΄κ²°νκΈ° μν΄ λ°μ΄ν° μ΄λ ν¨ν΄μ λΆμνκ³ , μ΄λ₯Ό κΈ°λ°μΌλ‘ μλΉ μμ€ν μ±λ₯μ ν₯μμν€λ λ°©λ²μ μ μν©λλ€. 2025λ μ μΆμλ 4κ°μ μ΅μ MoE λͺ¨λΈμ λν κ΄λ²μν νλ‘νμΌλ§μ ν΅ν΄ 6κ°μ§ μ£Όμ μΈμ¬μ΄νΈλ₯Ό λμΆνκ³ , μ΄λ₯Ό λ°νμΌλ‘ μ¨μ΄νΌ μ€μΌμΌ GPUμ μ±λ₯μ κ°μ νμ¬ DeepSeek V3 λ° Qwen3 λͺ¨λΈμμ κ°κ° 5.3λ°° λ° 3.1λ°°μ νκ· μλ ν₯μμ λ¬μ±νμ΅λλ€. λ³Έ μ°κ΅¬λ MoE λͺ¨λΈμ λ°μ΄ν° μ€μ¬ λΆμμ μ΅μ΄λ‘ μννκ³ , κ·Έ κ²°κ³Όλ₯Ό ꡬ체μ μΈ μ€κ³ μ°κ΅¬μ μ μ©νμ¬ μ±λ₯ ν₯μμ μ΄λμ΄λμ΅λλ€.
π μμ¬μ λ° νκ³
β’
MoE λͺ¨λΈ μλΉ μμ€ν μ λ°μ΄ν° μ΄λ ν¨ν΄μ μ΄ν΄νκ³ , μ΄λ₯Ό ν΅ν΄ μ±λ₯ λ³λͺ© νμμ νμ νμ¬ μμ€ν μ΅μ νμ λ°©ν₯μ±μ μ μνμ΅λλ€.
β’
λμΆλ μΈμ¬μ΄νΈλ₯Ό νμ©νμ¬ μ¨μ΄νΌ μ€μΌμΌ GPUμ κ°μ νλμ¨μ΄ μν€ν μ²λ₯Ό κ°μ ν¨μΌλ‘μ¨ MoE λͺ¨λΈμ μ±λ₯μ μ€μ§μ μΌλ‘ ν₯μμν¬ μ μμμ μ μ¦νμ΅λλ€.
β’
μ°κ΅¬λ νΉμ νλμ¨μ΄ (μ¨μ΄νΌ μ€μΌμΌ GPU)μ μ΄μ μ λ§μΆ° μ€κ³λμμΌλ©°, λ€λ₯Έ νλμ¨μ΄ νκ²½μμμ μ μ© κ°λ₯μ±μ λν μΆκ° μ°κ΅¬κ° νμν©λλ€. λν, λ€μν μν¬λ‘λμ λν μΆκ°μ μΈ μ€νμ ν΅ν΄ μΌλ°ν κ°λ₯μ±μ λμΌ νμκ° μμ΅λλ€.
PDF 보기
Made with Slashpage