Sign In

Learning Multi-Indicator Weights for Data Selection: A Joint Task-Model Adaptation Framework with Efficient Proxies

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Jingze Song, Zihao Chen, Wenqing Chen, Zibin Zheng

πŸ’‘ κ°œμš”

λ³Έ 논문은 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈμ˜ 효율적인 instruction tuning을 μœ„ν•œ 데이터 선택 문제λ₯Ό λ‹€λ£Ήλ‹ˆλ‹€. 기쑴의 정적이고 일반적인 κ°€μ€‘μΉ˜ μ„€μ • λ°©μ‹μ˜ ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κΈ° μœ„ν•΄, μ œμ•ˆν•˜λŠ” ν”„λ ˆμž„μ›Œν¬λŠ” λ‹€μš΄μŠ€νŠΈλ¦Ό νƒœμŠ€ν¬μ™€ νŠΉμ • λͺ¨λΈμ˜ μš”κ΅¬μ‚¬ν•­μ— 맞좰 데이터 선택 κ°€μ€‘μΉ˜λ₯Ό ν•™μŠ΅ν•©λ‹ˆλ‹€. μ΄λŠ” μ†Œκ·œλͺ¨ 검증 λ°μ΄ν„°μ…‹μ—μ„œμ˜ μΈμ»¨ν…μŠ€νŠΈ ν•™μŠ΅(ICL) μ‹ ν˜Έλ₯Ό ν™œμš©ν•˜μ—¬ μ™„μ „ν•œ νŒŒμΈνŠœλ‹ 없이 효율적으둜 졜적의 κ°€μ€‘μΉ˜λ₯Ό νƒμƒ‰ν•˜λ©°, μ‹€ν—˜ κ²°κ³Όμ—μ„œ μ™„μ „ 데이터셋 νŠœλ‹κ³Ό μœ μ‚¬ν•˜κ±°λ‚˜ 더 λ‚˜μ€ μ„±λŠ₯을 λ³΄μ΄λ©΄μ„œλ„ ν•™μŠ΅ 데이터 양을 크게 μ€„μ΄λŠ” μ„±κ³Όλ₯Ό μž…μ¦ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
데이터 ν’ˆμ§ˆμ΄ 양보닀 μ€‘μš”ν•˜λ‹€λŠ” κΈ°μ‘΄ 연ꡬλ₯Ό μ§€μ§€ν•˜λ©°, νƒœμŠ€ν¬μ™€ λͺ¨λΈμ— νŠΉν™”λœ 데이터 선택 μ „λž΅μ˜ μ€‘μš”μ„±μ„ κ°•μ‘°ν•©λ‹ˆλ‹€.
β€’
μ†Œκ·œλͺ¨ 검증 데이터셋과 ICL μ‹ ν˜Έλ₯Ό ν™œμš©ν•œ 효율적인 κ°€μ€‘μΉ˜ ν•™μŠ΅ 방법둠은 계산 λΉ„μš©μ„ μ ˆκ°ν•˜λ©΄μ„œλ„ 효과적인 데이터 선택이 κ°€λŠ₯함을 λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
μΆ”λ‘  νƒœμŠ€ν¬μ—μ„œ 의미둠적 λ‹€μ–‘μ„±κ³Ό 논리적 λ³΅μž‘μ„± κ°„μ˜ 상좩 관계λ₯Ό λ°ν˜€λ‚΄, νƒœμŠ€ν¬-λͺ¨λΈ 곡동 μ μ‘μ˜ ν•„μš”μ„±μ„ λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ λ°©λ²•λ‘ μ˜ μ„±λŠ₯이 νŠΉμ • νƒœμŠ€ν¬λ‚˜ λͺ¨λΈκ΅°μ— 따라 λ‹¬λΌμ§ˆ 수 있으며, ICL μ‹ ν˜Έμ˜ νš¨μœ¨μ„±κ³Ό 정확성을 λ”μš± 높이기 μœ„ν•œ 연ꡬ가 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘