Sign In

PACED: Distillation and On-Policy Self-Distillation at the Frontier of Student Competence

Created by
  • Haebom
Category
Empty

μ €μž

Yuanda Xu, Hejian Sang, Zhengze Zhou, Ran He, Zhipeng Wang

πŸ’‘ κ°œμš”

κΈ°μ‘΄ λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM) 증λ₯˜ 방식은 학생 λͺ¨λΈμ˜ ν•™μŠ΅ λŠ₯λ ₯에 상관없이 λͺ¨λ“  ν•™μŠ΅ 문제λ₯Ό λ™μΌν•˜κ²Œ μ²˜λ¦¬ν•˜μ—¬ λΉ„νš¨μœ¨μ„±μ„ μ•ΌκΈ°ν•©λ‹ˆλ‹€. λ³Έ μ—°κ΅¬λŠ” 학생 λͺ¨λΈμ˜ 문제 ν•΄κ²° 성곡λ₯ μ— 따라 λ¬Έμ œλ³„ ν•™μŠ΅ κ°€μ€‘μΉ˜λ₯Ό λ‹€λ₯΄κ²Œ λΆ€μ—¬ν•˜λŠ” PACED (Problem-Adaptive Competence-Equipped Distillation) 기법을 μ œμ•ˆν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 ν•™μŠ΅ νš¨μœ¨μ„±μ„ μ΅œμ ν™”ν•˜κ³ , 학생 λͺ¨λΈμ˜ 잠재적 λ°œλ‹¬ μ˜μ—­μ— μ§‘μ€‘ν•˜μ—¬ μ„±λŠ₯을 ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
핡심 μ‹œμ‚¬μ  1: 학생 λͺ¨λΈμ˜ 성취도에 κΈ°λ°˜ν•œ λ§žμΆ€ν˜• 문제 κ°€μ€‘μΉ˜ λΆ€μ—¬λŠ” LLM 증λ₯˜μ˜ νš¨μœ¨μ„±μ„ 크게 ν–₯μƒμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
핡심 μ‹œμ‚¬μ  2: PACEDλŠ” λ³„λ„μ˜ ν•˜μ΄νΌνŒŒλΌλ―Έν„°λ‚˜ μ•„ν‚€ν…μ²˜ λ³€κ²½ 없이 κ°„λ‹¨ν•œ 학생 λͺ¨λΈ λ‘€μ•„μ›ƒλ§ŒμœΌλ‘œ κ΅¬ν˜„ κ°€λŠ₯ν•˜λ©°, μˆ˜ν•™ 문제 ν•΄κ²° λ²€μΉ˜λ§ˆν¬μ—μ„œ κΈ°μ‘΄ 기법 λŒ€λΉ„ μƒλ‹Ήν•œ μ„±λŠ₯ ν–₯상을 λ³΄μ—¬μ£Όμ—ˆμŠ΅λ‹ˆλ‹€.
β€’
ν•œκ³„μ  λ˜λŠ” ν–₯ν›„ 과제: μ œμ•ˆλœ κΈ°λ²•μ˜ νš¨κ³ΌλŠ” 주둜 μˆ˜ν•™ 문제 ν•΄κ²° μ˜μ—­μ—μ„œ κ²€μ¦λ˜μ—ˆμœΌλ―€λ‘œ, λ‹€λ₯Έ λ„λ©”μΈμ—μ„œμ˜ μΌλ°˜ν™” κ°€λŠ₯μ„± 및 더 넓은 λ²”μœ„μ˜ 문제 μœ ν˜•μ— λŒ€ν•œ 적용 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘