haebom
Sign In
Filter-then-Weight: Online Data Selection and Reweighting for LLM Fine-Tuning
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Fangxin Wang, Peyman Baghershahi, Langzhou He, Henry Peng Zou, Sourav Medya, Philip S. Yu
π‘ κ°μ
λ³Έ λ Όλ¬Έμ μμ°¨μ μΌλ‘ λ°μνλ μ¨λΌμΈ LLM νμΈνλ νκ²½μμ μνμ μ μ©μ±μ ν¨κ³Όμ μΌλ‘ μΆμ νκ³ κ°μ€μΉλ₯Ό μ¬μ‘°μ νλ μλ‘μ΄ νλ μμν¬λ₯Ό μ μν©λλ€. μ μλ λ°©λ²μ μ΅ν°λ§μ΄μ μ νμ¬ μνλ₯Ό κ³ λ €νμ¬ λμ μ λ°μ΄νΈλ₯Ό λ§μΆ°λκ°λ λ°©μμΌλ‘ μν μ ν λ¬Έμ λ₯Ό μ¬μ μνκ³ , μ΄λ₯Ό ν΅ν΄ κΈ°μ‘΄ μ€νλΌμΈ λ°©μμ νκ³λ₯Ό 극볡ν©λλ€. μ€ν κ²°κ³Ό, μ μλ Filter-then-Weight μκ³ λ¦¬μ¦μ λ°μ΄ν° μμ° λ΄μμ μλ ΄ μλμ λ€μ΄μ€νΈλ¦Ό μ±λ₯μ ν¬κ² ν₯μμν€λ κ²μΌλ‘ λνλ¬μ΅λλ€.
π μμ¬μ λ° νκ³
β’
μ¨λΌμΈ LLM νμΈνλμμ μ΅ν°λ§μ΄μ μ μνλ₯Ό κ³ λ €ν λμ λ°μ΄ν° μ ν λ° κ°μ€μΉ μ¬μ‘°μ μ μ€μμ±μ κ°μ‘°ν©λλ€.
β’
볡μ‘ν μν κ° μνΈμμ©κ³Ό μ€λ³΅μ±μ κ³ λ €νμ¬ μ€μ νμΈνλ λͺ©νμ λΆν©νλ μ λ°μ΄νΈλ₯Ό λ§λλ μλ‘μ΄ μ κ·Ό λ°©μμ μ μν©λλ€.
β’
λκ·λͺ¨ μΈμ΄ λͺ¨λΈ λ° κΈ΄ 컨ν μ€νΈ λ°μ΄ν°μ μ μ© κ°λ₯νλλ‘ ν¨μ¨μ μΈ κ³μ° κΈ°λ²μ λμ νμ¬ μ€μ©μ±μ λμμ΅λλ€.
β’
λ³Έ μ°κ΅¬λ μν μ ν λ¬Έμ λ₯Ό 'μ λ°μ΄νΈ λ§€μΉ' λ¬Έμ λ‘ μ¬μ μνλ©°, μ΄λ ν₯ν μ¨λΌμΈ νμ΅ λ° λ°μ΄ν° κ΄λ¦¬ μ°κ΅¬μ μκ°μ μ€ μ μμ΅λλ€.
PDF 보기
Made with Slashpage