haebom
Sign In
Data Mixing Agent: Learning to Re-weight Domains for Continual Pre-training
Created by
Haebom
Category
Empty
μ μ
Kailai Yang, Xiao Liu, Lei Ji, Hao Li, Xiao Liang, Zhiwei Liu, Yeyun Gong, Peng Cheng, Mao Yang
π‘ κ°μ
λ³Έ λ Όλ¬Έμ λκ·λͺ¨ μΈμ΄ λͺ¨λΈμ μλ‘μ΄ λΆμΌμ μ§μμ μΌλ‘ μ¬μ νμ΅μν¬ λ λ°μνλ μΉλͺ μ μΈ λ§κ° λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν λ°μ΄ν° λ―Ήμ± μμ΄μ νΈ(Data Mixing Agent)λ₯Ό μ μν©λλ€. μ΄ μμ΄μ νΈλ κ°ν νμ΅μ ν΅ν΄ λ°μ΄ν° λ―Ήμ±μ μ΅μ λΉμ¨μ μλμΌλ‘ νμ΅νλ©°, μ΄λ₯Ό ν΅ν΄ μλ³Έ λͺ¨λΈμ λ₯λ ₯κ³Ό μλ‘μ΄ λΆμΌμμμ μ±λ₯μ κ· ν μκ² μ μ§ν©λλ€. μνμ μΆλ‘ λ° μ½λ μμ± λΆμΌμμμ μ€ν κ²°κ³Ό, μ μλ λ°©λ²μ κΈ°μ‘΄ ν΄λ¦¬μ€ν± κΈ°λ° λ°©μλ³΄λ€ μ°μν μ±λ₯μ 보μ΄λ©° λ°μ΄λ μΌλ°ν λ₯λ ₯μ μ μ¦νμ΅λλ€.
π μμ¬μ λ° νκ³
β’
κΈ°μ‘΄μ μλμ μΈ λ°μ΄ν° μ¬κ°μ€μΉ λ°©μμ λ²μ΄λ, κ°ν νμ΅ κΈ°λ°μ μλνλ λ°μ΄ν° λ―Ήμ± μ λ΅μ μ μνμ¬ μ§μμ μ¬μ νμ΅μ ν¨μ¨μ±μ λμμ΅λλ€.
β’
λ€μν λΆμΌ λ° λͺ¨λΈμ λν λ°μ΄λ μΌλ°ν λ₯λ ₯μ 보μ¬μ£Όμ΄, μ€μ μμ©μμμ μ μ°μ±κ³Ό μ€μ©μ±μ μ μ¦νμ΅λλ€.
β’
νμ΅λ μμ΄μ νΈμ κ°μ€μΉ κ²°μ λ°©μμ΄ μΈκ°μ μ§κ΄κ³Ό μ λΆν©νλ©°, λ μ μ μλ³Έ λ°μ΄ν°λ‘λ μ°μν λͺ¨λΈ μ±λ₯μ λ¬μ±ν μ μμμ νμΈνμ΅λλ€.
β’
κ°ν νμ΅ νκ²½ κ΅¬μΆ λ° νμ΅μ νμν λ°©λν μμ λ°μ΄ν° λ―Ήμ± κΆ€μ λ° νΌλλ°± λ°μ΄ν° μμ±μ΄ νμ΅ λΉμ©μ μ¦κ°μν¬ μ μμ΅λλ€.
PDF 보기
Made with Slashpage