Sign In

WriteSAE: Sparse Autoencoders for Recurrent State

μž‘μ„±μž
  • Haebom
μΉ΄ν…Œκ³ λ¦¬
Empty

μ €μž

Jack Young

πŸ’‘ κ°œμš”

λ³Έ 논문은 μˆœν™˜ μ–Έμ–΄ λͺ¨λΈμ˜ μƒνƒœ μ—…λ°μ΄νŠΈλ₯Ό μœ„ν•΄ ν¬μ†Œ μžλ™ 인코더(Sparse Autoencoder, SAE)인 WriteSAEλ₯Ό μ œμ•ˆν•œλ‹€. WriteSAEλŠ” λͺ¨λΈμ΄ μ‚¬μš©ν•˜λŠ” ν–‰λ ¬ ν˜•νƒœμ˜ μ—…λ°μ΄νŠΈμ™€ λ™μΌν•œ 크기의 랭크-1 ν–‰λ ¬ μ›μžλ₯Ό ν•™μŠ΅ν•˜μ—¬, λͺ¨λΈμ˜ μ›λž˜ μ—…λ°μ΄νŠΈλ₯Ό 직접 λŒ€μ²΄ν•  수 μžˆλ‹€. 이 방법을 톡해 κΈ°μ‘΄ λͺ¨λΈμ˜ λ™μž‘μ„ μ •λ°€ν•˜κ²Œ μž¬ν˜„ν•˜κ±°λ‚˜ μ œμ–΄ν•  수 있으며, 특히 Gated DeltaNetμ—μ„œλŠ” λ›°μ–΄λ‚œ 예츑 정확도λ₯Ό λ³΄μ˜€λ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
WriteSAEλŠ” μˆœν™˜ μ‹ κ²½λ§μ˜ λ‚΄λΆ€ μƒνƒœ μ—…λ°μ΄νŠΈ λ©”μ»€λ‹ˆμ¦˜μ„ 직접 ν•™μŠ΅ν•˜κ³  μ‘°μž‘ν•  수 μžˆλŠ” μƒˆλ‘œμš΄ 방법을 μ œμ‹œν•œλ‹€.
β€’
κΈ°μ‘΄ λͺ¨λΈμ˜ λ™μž‘μ„ μ΄ν•΄ν•˜κ³  μ œμ–΄ν•˜λŠ” 데 효과적이며, 특히 생성 κ³Όμ •μ—μ„œ νŠΉμ • ν† ν°μ˜ μΆœν˜„ ν™•λ₯ μ„ 크게 λ†’μ΄λŠ” 데 κΈ°μ—¬ν•œλ‹€.
β€’
μ œμ•ˆλœ 방법이 λ‹€μ–‘ν•œ λͺ¨λΈ ꡬ쑰(Mamba-2 λ“±)에 적용 κ°€λŠ₯함을 보여쀀닀.
β€’
이 방법이 μΊμ‹œ μˆ˜μ€€μ—μ„œ 직접적인 쑰정을 κ°€λŠ₯ν•˜κ²Œ ν•˜λŠ” 졜초의 연ꡬ 쀑 ν•˜λ‚˜λΌλŠ” 점이 μ€‘μš”ν•˜λ‹€.
β€’
ν–₯ν›„ μ—°κ΅¬μ—μ„œλŠ” 더 λ³΅μž‘ν•œ μƒνƒœ μ—…λ°μ΄νŠΈ νŒ¨ν„΄μ„ ν•™μŠ΅ν•˜λŠ” SAE의 μ„€κ³„λ‚˜, λ‹€λ₯Έ μ’…λ₯˜μ˜ μˆœν™˜ λͺ¨λΈ 및 자기 νšŒκ·€ λͺ¨λΈμ— λŒ€ν•œ 적용 κ°€λŠ₯성을 탐색할 ν•„μš”κ°€ μžˆλ‹€.
πŸ‘