Sign In

A Language-Guided Bayesian Optimization for Efficient LoRA Hyperparameter Search

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Baek Seong-Eun, Lee Jung-Mok, Kim Sung-Bin, Tae-Hyun Oh

πŸ’‘ κ°œμš”

λ³Έ 논문은 LoRA(Low-Rank Adaptation)의 ν•˜μ΄νΌνŒŒλΌλ―Έν„° νŠœλ‹μ„ 효율적으둜 μˆ˜ν–‰ν•˜κΈ° μœ„ν•œ μ–Έμ–΄ 기반 λ² μ΄μ§€μ•ˆ μ΅œμ ν™”(Bayesian Optimization, BO) ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. 이 방법은 사전 ν•™μŠ΅λœ LLM을 ν™œμš©ν•˜μ—¬ ν•˜μ΄νΌνŒŒλΌλ―Έν„°μ™€ κ΄€λ ¨λœ 도메인 지식을 연속적인 벑터 κ³΅κ°„μœΌλ‘œ λ§€ν•‘ν•˜κ³ , 이λ₯Ό 톡해 BO 탐색 νš¨μœ¨μ„±μ„ λ†’μž…λ‹ˆλ‹€. μ œμ•ˆλœ 방법은 μ–Έμ–΄ ν”„λ‘¬ν”„νŠΈμ™€ μΆ”κ°€ ν•™μŠ΅ κ°€λŠ₯ν•œ 토큰을 μ‚¬μš©ν•˜μ—¬ 도메인 지식을 μ£Όμž…ν•˜λ©°, ν”„λ‘μ‹œ ν•™μŠ΅ 및 평가λ₯Ό 톡해 계산 λΉ„μš©μ„ μ ˆκ°ν•˜μ—¬ 맀우 적은 반볡 νšŸμˆ˜λ‘œλ„ κΈ°μ‘΄ ν•˜μ΄νΌνŒŒλΌλ―Έν„° λŒ€λΉ„ μƒλ‹Ήν•œ μ„±λŠ₯ ν–₯상을 λ‹¬μ„±ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
사전 ν•™μŠ΅λœ LLM의 도메인 지식을 μ–Έμ–΄ ν”„λ‘¬ν”„νŠΈλ₯Ό 톡해 효과적으둜 ν™œμš©ν•˜μ—¬ LoRA ν•˜μ΄νΌνŒŒλΌλ―Έν„° 탐색 νš¨μœ¨μ„±μ„ 크게 ν–₯μƒμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
데이터 뢀뢄집합을 μ‚¬μš©ν•œ ν”„λ‘μ‹œ ν•™μŠ΅ 및 평가 기법은 전체 데이터셋을 μ‚¬μš©ν•˜λŠ” 것에 λΉ„ν•΄ 계산 λΉ„μš©μ„ 획기적으둜 μ ˆκ°ν•˜λ©΄μ„œλ„ μœ μ˜λ―Έν•œ μ„±λŠ₯ κ°œμ„ μ„ κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€.
β€’
언어적 ν‘œν˜„μ΄ μ–΄λ €μš΄ μž”μ—¬ 정보λ₯Ό ν¬μ°©ν•˜κΈ° μœ„ν•œ μΆ”κ°€ ν•™μŠ΅ κ°€λŠ₯ν•œ ν† ν°μ˜ λ„μž…μ€ BOκ°€ κ³ μ„±λŠ₯ ν•˜μ΄νΌνŒŒλΌλ―Έν„°λ₯Ό μƒ˜ν”Œλ§ν•˜λŠ” 데 κΈ°μ—¬ν•©λ‹ˆλ‹€.
β€’
ν”„λ‘¬ν”„νŠΈ μ„€κ³„μ˜ λ³΅μž‘μ„± 및 LLM의 μ–Έμ–΄ 이해 λŠ₯λ ₯에 λ”°λ₯Έ 잠재적인 μ œμ•½μ΄ μ‘΄μž¬ν•˜λ©°, 더 λ³΅μž‘ν•œ ν•˜μ΄νΌνŒŒλΌλ―Έν„° κ³΅κ°„μ΄λ‚˜ λ‹€λ₯Έ λͺ¨λΈ μ•„ν‚€ν…μ²˜μ— λŒ€ν•œ μΌλ°˜ν™” μ„±λŠ₯ 검증이 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘