haebom
Sign In
Pretraining large language models with MXFP4 on Native FP4 Hardware
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Musa Cim, Poovaiah Palangappa, Miro Hodak, Ravi Dwivedula, Meena Arunachalam, Mahmut Taylan Kandemir
π‘ κ°μ
λ³Έ μ°κ΅¬λ λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ FP4(4λΉνΈ λΆλμμμ ) μ 체 νμ΄νλΌμΈ νμ΅μ΄ λ°μ°νλ μ΄μ λ₯Ό νꡬν©λλ€. νΉν, μλ°©ν₯ μ ν(Fprop) λ° νμ±ν κΈ°μΈκΈ°(Dgrad)κ° μμ μ μΈ μνμμλ νμ΅μ΄ λΆμμ ν΄μ§λ λ¬Έμ λ₯Ό λ€λ£Ήλλ€. μ°κ΅¬μ§μ κ°μ€μΉ κΈ°μΈκΈ°(Wgrad)μ FP4 μμνκ° νμ΅ λΆμμ μ μ£Όλ μμΈμμ λ°κ²¬νμΌλ©°, μ΄λ₯Ό ν΄κ²°νκΈ° μν΄ κ²°μ λ‘ μ νλ€λ§λ νμ μ νμ©νμ¬ μμ μ μΈ μ΅μ νλ₯Ό 볡μν μ μμμ μ μν©λλ€.
π μμ¬μ λ° νκ³
β’
FP4 μμν μ, νΉν κ°μ€μΉ κΈ°μΈκΈ°(Wgrad) μμνκ° LLM νμ΅μ μλ ΄ μ±λ₯ μ νλ₯Ό μΌκΈ°νλ μ£Όμ μμΈμ λλ€.
β’
κ²°μ λ‘ μ νλ€λ§λ νμ κ³Ό κ°μ ꡬ쑰μ μΈ κΈ°λ²μ FP4 νμ΅ μ λ°μνλ λΆμμ μ±μ ν¨κ³Όμ μΌλ‘ μννμ¬ μμ μ μΈ μ΅μ νλ₯Ό κ°λ₯νκ² ν©λλ€.
β’
μ°κ΅¬ κ²°κ³Όλ FP4 νμ΅ λΆμμ μ±μ΄ 무μμμ± λΆμ‘±λ³΄λ€λ λ―Όκ°ν κΈ°μΈκΈ° κ²½λ‘λ₯Ό λ°λΌ λ°μνλ ꡬ쑰μ μΈ λ―ΈμΈ μ€μΌμΌ μ€λ₯μ κΈ°μΈν¨μ μμ¬ν©λλ€.
β’
λ³Έ μ°κ΅¬λ AMD Instinct MI355X GPUμ λ€μ΄ν°λΈ MXFP4 μ§μμ νμ©νμ¬ μ€νμ μννμμΌλ, λ€λ₯Έ νλμ¨μ΄ λ° λͺ¨λΈ μν€ν μ²μμμ μΌλ°ν κ°λ₯μ±μ λν μΆκ° μ°κ΅¬κ° νμν©λλ€.
PDF 보기
Made with Slashpage