haebom
Sign In
RaBiT: Residual-Aware Binarization Training for Accurate and Efficient LLMs
Created by
Haebom
Category
Empty
μ μ
Youngcheon You, Banseok Lee, Minseop Choi, Seonyoung Kim, Hyochan Chong, Changdong Kim, Youngmin Kim, Dongkyu Kim
π‘ κ°μ
λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ ν¨μ¨μ μΈ λ°°ν¬λ₯Ό μν΄μλ κ·Ήλ¨μ μΈ μμνκ° νμμ μ΄μ§λ§, μ΄λ μ±λ₯ μ νλ₯Ό μΌκΈ°ν©λλ€. λ³Έ λ Όλ¬Έμ μμ°¨ μ΄μ§ν(residual binarization)μμ λ°μνλ λ³λ ¬ μμ°¨ κ²½λ‘ κ°μ νΉμ§ μ¬μ μ(inter-path adaptation) λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄, κ° μ΄μ§ κ²½λ‘κ° μ΄μ κ²½λ‘μ μ€λ₯λ₯Ό 보μνλλ‘ μκ³ λ¦¬μ¦μ μΌλ‘ κ³μΈ΅ ꡬ쑰λ₯Ό κ°μ νλ μλ‘μ΄ μμν νλ μμν¬μΈ RaBiTλ₯Ό μ μν©λλ€. RaBiTλ 2λΉνΈ μ νλ-ν¨μ¨μ± μΈ‘λ©΄μμ μ΅μ²¨λ¨ μ±λ₯μ λ¬μ±νλ©°, λ²‘ν° μμν(VQ) λ°©λ²κ³Όλ κ²½μν μ μλ μμ€μΌλ‘, RTX 4090μμ ν μ λ°λ λͺ¨λΈ λλΉ 4.49λ°°μ μΆλ‘ μλ ν₯μμ μ 곡ν©λλ€.
π μμ¬μ λ° νκ³
β’
κ·Ήλ¨μ μΈ μμν νκ²½μμ μμ°¨ μ΄μ§νμ μ±λ₯ μ νλ₯Ό μ λ°νλ ν΅μ¬ μμΈμΈ 'νΉμ§ μ¬μ μ' λ¬Έμ λ₯Ό κ·λͺ νκ³ μκ³ λ¦¬μ¦μ μΌλ‘ ν΄κ²°νμ΅λλ€.
β’
μ μλ RaBiT νλ μμν¬λ κΈ°μ‘΄μ ν΄λ¦¬μ€ν± λ°©μκ³Ό λ¬λ¦¬, λͺ μμ μΈ κ³μΈ΅ ꡬ쑰λ₯Ό ν΅ν΄ μμ°¨ κ²½λ‘ κ°μ ν¨μ¨μ μΈ μ€λ₯ 보μ λ° νΉμ§ νμ΅μ κ°λ₯νκ² νμ¬ 2λΉνΈ LLMμ μ±λ₯μ ν¬κ² ν₯μμμΌ°μ΅λλ€.
β’
μ°κ΅¬ κ²°κ³Όλ κ·Ήλ¨μ μΈ μμν μν©μμλ LLMμ λμ μ νλμ ν¨μ¨μ±μ λμμ λ¬μ±ν μ μμμ μ μ¦νμΌλ©°, νλμ¨μ΄ μ§μ½μ μΈ μμν λ°©λ²κ³Όλ κ²½μν μ μλ κ°λ₯μ±μ μ μν©λλ€.
β’
μμ§ λ€μν LLM μν€ν μ²μ νμ€ν¬μ λν RaBiTμ μΌλ°ν μ±λ₯μ λν μΆκ°μ μΈ κ²μ¦μ΄ νμν©λλ€.
PDF 보기
Made with Slashpage