Sign In

CRAFT: Forgetting-Aware Intervention-Based Adaptation for Continual Learning

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Md Anwar Hossen, Fatema Siddika, Juan Pablo Munoz, Tanya Roosta, Ali Jannesari

πŸ’‘ κ°œμš”

이 논문은 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)의 지속적인 ν•™μŠ΅ κ³Όμ •μ—μ„œ λ°œμƒν•˜λŠ” 치λͺ…적인 망각(catastrophic forgetting) 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ λͺ¨λΈ κ°€μ€‘μΉ˜λ₯Ό 직접 μˆ˜μ •ν•˜λŠ” λŒ€μ‹ , 은닉 ν‘œν˜„(hidden representations)에 저차원 κ°œμž…(low-rank interventions)을 μ μš©ν•˜λŠ” CRAFT ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. CRAFTλŠ” μž‘μ—… λΌμš°νŒ…, μ •κ·œν™”, 톡합 과정을 KL λ°œμ‚°μ„ 톡해 단일 λͺ©ν‘œλ‘œ ν†΅ν•©ν•˜μ—¬ 망각을 효과적으둜 μ œμ–΄ν•˜κ³  μ„±λŠ₯을 ν–₯μƒμ‹œν‚΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM의 지속적인 ν•™μŠ΅μ—μ„œ λͺ¨λΈ κ°€μ€‘μΉ˜ μ—…λ°μ΄νŠΈ 없이도 망각을 쀄이고 μ„±λŠ₯을 ν–₯μƒμ‹œν‚€λŠ” 효과적인 방법둠을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
좜λ ₯ κ³΅κ°„μ˜ 뢄포 λ°œμ‚°μ„ 기반으둜 μž‘μ—… κ°„μ˜ μœ μ‚¬μ„±μ„ νŒŒμ•…ν•˜κ³ , 이λ₯Ό 톡해 망각 μ œμ–΄ 및 μˆ˜λ ΄μ„ 효과적으둜 μ‘°μ ˆν•©λ‹ˆλ‹€.
β€’
KL λ°œμ‚°μ„ μ€‘μ‹¬μœΌλ‘œ λΌμš°νŒ…, μ •κ·œν™”, 톡합 과정을 ν†΅ν•©ν•˜μ—¬ ν™•μž₯ κ°€λŠ₯ν•˜κ³  원칙적인 지속 ν•™μŠ΅ ν”„λ ˆμž„μ›Œν¬λ₯Ό κ΅¬μΆ•ν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ CRAFT 방법은 λ‹€μ–‘ν•œ λ²€μΉ˜λ§ˆν¬μ™€ λͺ¨λΈ 규λͺ¨μ—μ„œ κΈ°μ‘΄ LoRA 기반 μ ‘κ·Ό 방식보닀 μš°μˆ˜ν•œ μ„±λŠ₯을 보이며 μž‘μ—… μˆœμ„œμ—λ„ 강건함을 λ‚˜νƒ€λƒ…λ‹ˆλ‹€.
πŸ‘