Sign In

On-the-Fly Adaptation to Quantization: Configuration-Aware LoRA for Efficient Fine-Tuning of Quantized LLMs

Created by
  • Haebom
Category
Empty

μ €μž

Rongguang Ye, Ming Tang, Edith C. H. Ngai

πŸ’‘ κ°œμš”

λŒ€κ·œλͺ¨ 사전 ν•™μŠ΅ λͺ¨λΈμ˜ μ—£μ§€ λ””λ°”μ΄μŠ€ 배포λ₯Ό μœ„ν•΄ μ–‘μžν™”μ™€ LoRA μ–΄λŒ‘ν„° λ―Έμ„Έ 쑰정을 κ²°ν•©ν•˜λŠ” 것은 λͺ¨λΈ 크기λ₯Ό 쀄이고 정확도 손싀을 μ™„ν™”ν•˜λŠ” 효과적인 λ°©λ²•μž…λ‹ˆλ‹€. ν•˜μ§€λ§Œ μ—£μ§€ λ””λ°”μ΄μŠ€μ˜ 이질적인 μ»΄ν“¨νŒ… λŠ₯λ ₯으둜 인해 λͺ¨λ“  μ–‘μžν™” 섀정에 λŒ€ν•΄ κ°œλ³„μ μœΌλ‘œ λ―Έμ„Έ 쑰정을 μˆ˜ν–‰ν•˜λŠ” 것은 λΉ„νš¨μœ¨μ μž…λ‹ˆλ‹€. λ³Έ 논문은 CoA-LoRAλ₯Ό μ œμ•ˆν•˜μ—¬, 반볡적인 λ―Έμ„Έ μ‘°μ • 없이 μž„μ˜μ˜ μ–‘μžν™” 섀정에 λ™μ μœΌλ‘œ LoRA μ–΄λŒ‘ν„°λ₯Ό μ‘°μ •ν•˜λŠ” 방법을 μ œμ‹œν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
동적 적응성: CoA-LoRAλŠ” 사전 ν•™μŠ΅λœ λͺ¨λΈμ˜ 각 λ ˆμ΄μ–΄ λΉ„νŠΈν­ 선택과 같은 λ‹€μ–‘ν•œ μ–‘μžν™” 섀정에 맞좰 LoRA μ–΄λŒ‘ν„°λ₯Ό λ™μ μœΌλ‘œ μ‘°μ •ν•¨μœΌλ‘œμ¨, 각 μ„€μ •λ§ˆλ‹€ λ³„λ„μ˜ λ―Έμ„Έ μ‘°μ • 없이 효율적인 배포λ₯Ό κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€.
β€’
효율적인 ν•™μŠ΅ ꡬ성: Pareto 기반 μ΅œμ ν™”λ₯Ό 톡해 효율적인 ν•™μŠ΅ ꡬ성 집합을 νƒμƒ‰ν•¨μœΌλ‘œμ¨, 저차원 μ‘°μ •μ˜ 정확도λ₯Ό ν–₯μƒμ‹œν‚€κ³  ν•™μŠ΅ λΉ„μš©μ„ μ ˆκ°ν•©λ‹ˆλ‹€.
β€’
ν•œκ³„μ : CoA-LoRA의 μ„±λŠ₯은 ν•™μŠ΅ ꡬ성 μ§‘ν•©μ˜ ν’ˆμ§ˆμ— 크게 μ˜μ‘΄ν•˜λ©°, κ³ ν’ˆμ§ˆμ˜ ν•™μŠ΅ ꡬ성 집합을 κ΅¬μΆ•ν•˜λŠ” 것이 μ—¬μ „νžˆ μ€‘μš”ν•œ 과제둜 λ‚¨μ•„μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘