Sign In

Soft-TransFormers for Continual Learning

Created by
  • Haebom
Category
Empty

μ €μž

Haeyong Kang, Chang D. Yoo

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” 사전 ν•™μŠ΅λœ 트랜슀포머 λͺ¨λΈμ˜ κ°€μ€‘μΉ˜λ₯Ό κ³ μ •ν•œ 채, νƒœμŠ€ν¬ 적응을 μœ„ν•œ νŒŒλΌλ―Έν„° 효율적인 지속 ν•™μŠ΅ ν”„λ ˆμž„μ›Œν¬μΈ Soft-Transformer(Soft-TF)λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. Soft-TFλŠ” λͺ…μ‹œμ μΈ ν”„λ‘¬ν”„νŠΈλ‚˜ μ–΄λŒ‘ν„° λŒ€μ‹ , μ…€ν”„ μ–΄ν…μ…˜ λ©”μ»€λ‹ˆμ¦˜μ˜ ν‚€, 쿼리, κ°’, 좜λ ₯ νˆ¬μ˜μ— μ μš©λ˜λŠ” μ‹€μˆ˜ν˜• 마슀크λ₯Ό ν•™μŠ΅ν•˜μ—¬ νƒœμŠ€ν¬λ³„λ‘œ λΆ€λ“œλŸ½κ³  μ•ˆμ •μ μΈ 적응을 κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
기쑴의 ν”„λ‘¬ν”„νŠΈ 기반, μ–΄λŒ‘ν„° 기반, LoRA 방식보닀 λ›°μ–΄λ‚œ μ„±λŠ₯을 λ³΄μ΄λ©΄μ„œλ„ 적은 수의 μΆ”κ°€ νŒŒλΌλ―Έν„°λ§Œμ„ μš”κ΅¬ν•˜λŠ” 효율적인 지속 ν•™μŠ΅ 기법을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
ν•™μŠ΅λœ μ‹€μˆ˜ν˜• 마슀크λ₯Ό 톡해 κΈ°μ‘΄ 지식을 λ³΄μ‘΄ν•˜κ³  치λͺ…적 망각을 효과적으둜 μ™„ν™”ν•˜λŠ” λ™μ‹œμ—, λΆ€λ“œλŸ½κ³  μ•ˆμ •μ μΈ νƒœμŠ€ν¬ 적응을 λ‹¬μ„±ν•©λ‹ˆλ‹€.
β€’
ν•™μŠ΅λœ μ‹€μˆ˜ν˜• 마슀크의 해석 κ°€λŠ₯μ„± 및 λ‹€μ–‘ν•œ 트랜슀포머 μ•„ν‚€ν…μ²˜λ‘œμ˜ μΌλ°˜ν™” κ°€λŠ₯성에 λŒ€ν•œ μΆ”κ°€ 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘