haebom
Sign In
UniSD: Towards a Unified Self-Distillation Framework for Large Language Models
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Yiqiao Jin, Yiyang Wang, Lucheng Fu, Yijia Xiao, Yinyi Luo, Haoxin Liu, B. Aditya Prakash, Josiah Hester, Jindong Wang, Srijan Kumar
π‘ κ°μ
λ³Έ λ Όλ¬Έμ λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ μΈλΆμ λ κ°λ ₯ν λͺ¨λΈ μμ΄ μ μμν€λ μ λ§ν λ°©λ²μΈ μκΈ° μ¦λ₯(Self-Distillation, SD)λ₯Ό μν ν΅ν© νλ μμν¬μΈ UniSDλ₯Ό μ μνλ€. UniSDλ supervisionμ μ λ’°μ±, νν μΌμΉ, νλ ¨ μμ μ±μ κ°μ νκΈ° μν΄ λ€μ€ κ΅μ¬ λμ, EMA κ΅μ¬ μμ ν, ν ν° μμ€ λμ‘° νμ΅, νΉμ§ λ§€μΉ, λ°μ° ν΄λ¦¬ν λ± μνΈ λ³΄μμ μΈ λ©μ»€λμ¦μ ν΅ν©νλ€. μ΄λ₯Ό ν΅ν΄ LLM μ μμ ν¨μ¨μ±κ³Ό μ±λ₯ ν₯μμ λ¬μ±νλ€.
π μμ¬μ λ° νκ³
β’
μκΈ° μ¦λ₯λ μΈλΆμ λ κ°λ ₯ν κ΅μ¬ λͺ¨λΈ μμ΄λ LLMμ μ±λ₯μ ν₯μμν¬ μ μλ μ€μ©μ μ΄κ³ μ μ΄ κ°λ₯ν μ κ·Ό λ°©μμ΄λ€.
β’
UniSD νλ μμν¬λ SDμ λ€μν κ΅¬μ± μμλ€μ ν¨κ³Όμ μνΈμμ©μ 체κ³μ μΌλ‘ λΆμνμ¬ μ΅μ μ μ±λ₯μ λ¬μ±νλ ν΅ν© νμ΄νλΌμΈμ ꡬμΆνλ λ° κΈ°μ¬νλ€.
β’
λ³Έ μ°κ΅¬μμ μ μλ κ° κ΅¬μ± μμμ ν¨κ³Όμ μνΈμμ©μ νΉμ μμ λ° λͺ¨λΈ μν€ν μ²μ λ°λΌ λ¬λΌμ§ μ μμΌλ©°, λ²μ©μ μΈ μ μ©μ μν μΆκ°μ μΈ μ°κ΅¬κ° νμνλ€.
PDF 보기
Made with Slashpage