Sign In

UniSD: Towards a Unified Self-Distillation Framework for Large Language Models

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Yiqiao Jin, Yiyang Wang, Lucheng Fu, Yijia Xiao, Yinyi Luo, Haoxin Liu, B. Aditya Prakash, Josiah Hester, Jindong Wang, Srijan Kumar

πŸ’‘ κ°œμš”

λ³Έ 논문은 κ°•λ ₯ν•œ μ™ΈλΆ€ 지도 없이 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)을 효과적으둜 μ μ‘μ‹œν‚€λŠ” μƒˆλ‘œμš΄ λ°©λ²•μœΌλ‘œ 톡합 자기 증λ₯˜(UniSD) ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. UniSDλŠ” κ°λ…μ˜ μ‹ λ’°μ„±, ν‘œν˜„ 일치, ν•™μŠ΅ μ•ˆμ •μ„±μ„ κ°œμ„ ν•˜κΈ° μœ„ν•΄ μ—¬λŸ¬ λ©”μ»€λ‹ˆμ¦˜μ„ κ²°ν•©ν•˜μ—¬ κΈ°μ‘΄ 자기 증λ₯˜ λ°©μ‹μ˜ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•©λ‹ˆλ‹€. μ œμ•ˆλœ 톡합 νŒŒμ΄ν”„λΌμΈμΈ UniSDfull은 μ—¬λŸ¬ λ²€μΉ˜λ§ˆν¬μ—μ„œ κ°•λ ₯ν•œ μ„±λŠ₯ ν–₯상을 보여주며, LLM의 효율적인 적응을 μœ„ν•œ μ‹€μš©μ μΈ μ ‘κ·Ό 방식을 μ œμ‹œν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
자기 증λ₯˜λŠ” μ™ΈλΆ€ 지도 없이 LLM을 효과적으둜 κ°œμ„ ν•  수 μžˆλŠ” μœ λ§ν•œ 방법이며, 특히 μ—¬λŸ¬ λ©”μ»€λ‹ˆμ¦˜μ„ 톡합할 λ•Œ μ‹œλ„ˆμ§€κ°€ λ°œμƒν•©λ‹ˆλ‹€.
β€’
UniSD ν”„λ ˆμž„μ›Œν¬λŠ” 자기 증λ₯˜μ˜ 핡심 ꡬ성 μš”μ†Œλ“€μ„ μ²΄κ³„μ μœΌλ‘œ μ—°κ΅¬ν•˜κ³  κ·Έ μƒν˜Έμž‘μš©μ„ λ°ν˜€λƒ„μœΌλ‘œμ¨, μ–΄λ–€ ꡬ성 μš”μ†Œκ°€ μ„±λŠ₯ ν–₯상을 μ£Όλ„ν•˜κ³  μ–΄λ–»κ²Œ μƒν˜Έμž‘μš©ν•˜λŠ”μ§€μ— λŒ€ν•œ μ€‘μš”ν•œ 톡찰을 μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
아직 자기 증λ₯˜μ˜ 각 ꡬ성 μš”μ†Œκ°€ νŠΉμ • μž‘μ—…μ΄λ‚˜ λͺ¨λΈ μ•„ν‚€ν…μ²˜μ— λŒ€ν•΄ 졜적의 μ„±λŠ₯을 λ°œνœ˜ν•˜λŠ”μ§€μ— λŒ€ν•œ 보닀 심측적인 연ꡬ와, κ·Ήλ„λ‘œ λ³΅μž‘ν•˜κ±°λ‚˜ λΉ„μ •ν˜•μ μΈ μž‘μ—…μ— λŒ€ν•œ 적용 κ°€λŠ₯성을 탐색할 ν•„μš”κ°€ μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘