haebom
Sign In
SFTMix: Elevating Language Model Instruction Tuning with Mixup Recipe
Created by
Haebom
Category
Empty
μ μ
Yuxin Xiao, Shujian Zhang, Wenxuan Zhou, Marzyeh Ghassemi, Sanqiang Zhao
π‘ κ°μ
λ³Έ λ Όλ¬Έμ κΈ°μ‘΄ μ§λ νμ΅ λ―ΈμΈ μ‘°μ (SFT) λ°©μμμ λ°μ΄ν° νμ§μ λν μμ‘΄μ±μ μ€μ΄κ³ μ Mixup κΈ°λ²μ νμ©ν μλ‘μ΄ SFTMix λ μνΌλ₯Ό μ μν©λλ€. SFTMixλ μΈμ΄ λͺ¨λΈμ΄ μ§μλ₯Ό λ°λ₯΄λ λ₯λ ₯μ ν₯μμν€κΈ° μν΄, λ€μν μ λ’°λ μμ€μ κ°μ§ μμ λ€μ νμ΅ λμνμ ν΅ν΄ μλ³νκ³ μ΄λ₯Ό 보κ°(interpolation)ν¨μΌλ‘μ¨ μ λ’°λ 격차λ₯Ό ν΄μν©λλ€. μ μλ SFTMixλ LLM μ νκ΅°, λ°μ΄ν°μ ν¬κΈ° λ° νμ§μ κ΄κ³μμ΄ μΌκ΄λ μ±λ₯ ν₯μμ 보μ¬μ€λλ€.
π μμ¬μ λ° νκ³
β’
SFTMixλ κ³ νμ§ λ°μ΄ν°μ ꡬμΆμ λλ λΉμ©κ³Ό λ Έλ ₯μ μ κ°νλ©΄μλ LLMμ μ§μ μν λ₯λ ₯μ ν¨κ³Όμ μΌλ‘ ν₯μμν¬ μ μμ΅λλ€.
β’
Mixup κΈ°λ°μ μ κ·ν κΈ°λ²μ ν΅ν΄ 보κ°λ μμ λ€μ λν νμ΅μ μ§μνλ©°, λ°μ΄ν° μ ν, κ³μ° μ μ½ νκ²½, λ€μν μ μ© μ¬λ‘μ λν νΈνμ±μ μ μ¦νμ΅λλ€.
β’
SFTMixμ ν¨κ³Όλ₯Ό κ·ΉλννκΈ° μν μ΅μ μ Mixup λΉμ¨ λ° μ λ’°λ μλ³ κΈ°μ€μ λν μΆκ°μ μΈ μ°κ΅¬κ° νμν μ μμ΅λλ€.
PDF 보기
Made with Slashpage