haebom
Sign In
Does the Question Really Matter? Training-Free Data Selection for Vision-Language SFT
Created by
Haebom
Category
Empty
μ μ
Peng Sun, Huawen Shen, Yi Ban, Tianfan Fu, Yanbo Wang, Yuqiang Li
π‘ κ°μ
λ³Έ μ°κ΅¬λ Vision-Language Large Models (VLLMs)μ μ±λ₯ ν₯μμ μν μκ°μ λͺ λ Ήμ΄ νλ λ°μ΄ν° μ μ λ¬Έμ λ₯Ό λ€λ£Ήλλ€. κΈ°μ‘΄ λ°©μλ€μ΄ μΈμ΄ ν¨ν΄μ΄λ μμμ μμ‘΄νλ μνμ ν¨κ³Όμ μΌλ‘ κ±Έλ¬λ΄μ§ λͺ»νλ νκ³λ₯Ό 극볡νκ³ μ, μ§λ¬Έμ΄ λ΅λ³ μ ν¨μ±μ λ―ΈμΉλ μν₯μ μΈ‘μ νλ νλ ¨ μλ μλ‘μ΄ λ°μ΄ν° μ μ λ°©λ²λ‘ μΈ CVSλ₯Ό μ μν©λλ€. CVSλ μ§λ¬Έμ ν¬ν¨νμ λμ ν¬ν¨νμ§ μμμ λμ λ΅λ³ μ ν¨μ± λΆμΌμΉλ₯Ό μΈ‘μ νμ¬ μ§μ ν μκ°-μΈμ΄ μΆλ‘ μ μꡬνλ μνμ μλ³νκ³ , μ€νμ ν΅ν΄ ν¨μ¨μ±κ³Ό μ±λ₯ μ°μμ±μ μ μ¦νμ΅λλ€.
π μμ¬μ λ° νκ³
β’
μ§μ ν μκ°-μΈμ΄ μΆλ‘ μ λ:
μ§λ¬Έμ λμ μ΄ λͺ¨λΈμ λ΅λ³ μ ν¨μ± νλ¨μ μλΉν μν₯μ λ―ΈμΉλ μνμ μ νν¨μΌλ‘μ¨, λͺ¨λΈμ΄ λ¨μν μΈμ΄μ ν¨ν΄μ΄ μλ μ€μ μκ°-μΈμ΄ μΆλ‘ μ μννλλ‘ μ λν©λλ€.
β’
ν¨μ¨μ μΈ λ°μ΄ν° μ μ :
λ³λμ λͺ¨λΈ νλ ¨ μμ΄ ν¨μ¨μ μΌλ‘ κ³ νμ§ λ°μ΄ν°λ₯Ό μ μ νμ¬, λ°μ΄ν° μ μ λΉμ©μ μ κ°νκ³ νλ μ±λ₯μ ν₯μμν¬ μ μμ΅λλ€.
β’
κ³μ° λΉμ© μ κ°:
κΈ°μ‘΄μ 볡μ‘ν λ°μ΄ν° μ μ λ°©λ²λ‘ λλΉ μλΉν κ³μ° λΉμ© μ κ° ν¨κ³Όλ₯Ό 보μ¬μ£Όλ©°, λ μ μ λ°μ΄ν°λ‘λ λ°μ΄λ μ±λ₯μ λ¬μ±ν μ μμμ μ μ¦νμ΅λλ€.
PDF 보기
Made with Slashpage