Sign In

Attention in Constant Time: Vashista Sparse Attention for Long-Context Decoding with Exponential Guarantees

Created by
  • Haebom
Category
Empty

μ €μž

Vashista Nobaub

πŸ’‘ κ°œμš”

λ³Έ 논문은 κΈ΄ λ¬Έλ§₯을 μ²˜λ¦¬ν•  λ•Œ λ°œμƒν•˜λŠ” μ–Έμ–΄ λͺ¨λΈμ˜ μΆ”λ‘  λΉ„μš© 문제λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄, μ‹€μ œλ‘œλŠ” μ†Œμˆ˜μ˜ ν† ν°λ§Œμ΄ 각 쿼리에 의미 있게 κΈ°μ—¬ν•œλ‹€λŠ” ν˜„μƒμ— μ£Όλͺ©ν•©λ‹ˆλ‹€. 이λ₯Ό λ°”νƒ•μœΌλ‘œ μ—”νŠΈλ‘œν”½(softmax) 이완을 톡해 주의 λ©”μ»€λ‹ˆμ¦˜μ„ 근둝 껍질(convex hull)둜 νˆ¬μ˜ν•˜λŠ” λͺ¨λΈμ„ μ œμ•ˆν•˜λ©°, νŠΉμ • 쑰건(strict complementarity margin) ν•˜μ—μ„œ 주의 λ©”μ»€λ‹ˆμ¦˜μ΄ μƒμˆ˜ 크기의 ν™œμ„± μ˜μ—­μ— μ§‘μ€‘λ˜κ³  λΉ„ν™œμ„± 토큰에 ν• λ‹Ήλ˜λŠ” μ§ˆλŸ‰μ΄ μ§€μˆ˜μ μœΌλ‘œ κ°μ†Œν•¨μ„ 이둠적으둜 증λͺ…ν•©λ‹ˆλ‹€. μ΄λŸ¬ν•œ 이둠적 보μž₯에 κΈ°λ°˜ν•˜μ—¬, Vashista Sparse Attentionμ΄λΌλŠ” μƒˆλ‘œμš΄ λ©”μ»€λ‹ˆμ¦˜μ„ λ„μž…ν•˜μ—¬ μ‹€μ œ κΈ΄ λ¬Έλ§₯ ν‰κ°€μ—μ„œ μƒμˆ˜ 크기의 유효 지원(effective support)κ³Ό 속도 ν–₯상을 λ‹¬μ„±ν–ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
μƒμˆ˜ μ‹œκ°„ 주의 λ©”μ»€λ‹ˆμ¦˜μ˜ 이둠적 기반 마련: νŠΉμ • 쑰건을 λ§Œμ‘±ν•  λ•Œ, κΈ΄ λ¬Έλ§₯μ—μ„œλ„ 주의 λ©”μ»€λ‹ˆμ¦˜μ΄ μƒμˆ˜ μ‹œκ°„ λ³΅μž‘λ„λ‘œ μž‘λ™ν•  수 μžˆμŒμ„ 이둠적으둜 증λͺ…ν•˜μ—¬ 효율적인 κΈ΄ λ¬Έλ§₯ μ²˜λ¦¬μ— λŒ€ν•œ 학문적 ν† λŒ€λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
μ‹€μš©μ μΈ ν¬μ†Œ 주의 κΈ°μ€€ μ œμ‹œ: μ—”νŠΈλ‘œν”½ 주의의 μˆ˜ν•™μ  뢄석을 톡해, μ–Έμ œ ν¬μ†Œ 주의(sparse attention)κ°€ μ•ˆμ „ν•˜κ²Œ 적용될 수 μžˆλŠ”μ§€μ— λŒ€ν•œ λͺ…ν™•ν•œ 기쀀을 μ œμ‹œν•˜λ©°, 정확도와 μ»΄ν“¨νŒ… μžμ› κ°„μ˜ κ· ν˜•μ„ μ‘°μ ˆν•  수 μžˆλŠ” μ‹€μ§ˆμ μΈ 방법을 μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
Vashista Sparse Attention의 싀증적 검증: μ œμ•ˆλœ Vashista Sparse Attention λ©”μ»€λ‹ˆμ¦˜μ΄ μ‹€μ œ κΈ΄ λ¬Έλ§₯ ν‰κ°€μ—μ„œ 이둠적 μ˜ˆμΈ‘λŒ€λ‘œ μƒμˆ˜ 크기의 유효 지원을 μœ μ§€ν•˜κ³ , λΉ λ₯Έ 속도와 μ΅œμ†Œν•œμ˜ ν’ˆμ§ˆ μ €ν•˜λ₯Ό 달성함을 λ³΄μ—¬μ€λ‹ˆλ‹€.
β€’
ν”„λΌμ΄λ²„μ‹œ 및 에어갭 ν™˜κ²½μ—μ„œμ˜ 적용 κ°€λŠ₯μ„±: λ³„λ„μ˜ μ™ΈλΆ€ 검색 없이 예츑 κ°€λŠ₯ν•œ μ§€μ—° μ‹œκ°„κ³Ό λΉ„μš©μœΌλ‘œ μž‘λ™ν•˜λŠ” λŒ€μ²΄ κ°€λŠ₯ν•œ 주의 λͺ¨λ“ˆλ‘œμ„œ, ν”„λΌμ΄λ²„μ‹œκ°€ μ€‘μš”ν•˜κ±°λ‚˜ μ™ΈλΆ€ 연결이 λΆˆκ°€λŠ₯ν•œ ν™˜κ²½μ—μ„œμ˜ 배포 κ°€λŠ₯성을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
ν•œκ³„μ : λ…Όλ¬Έμ—μ„œ μ œμ‹œλœ 'strict complementarity margin' 쑰건이 μ‹€μ œ λͺ¨λ“  μƒν™©μ—μ„œ 만쑱될 수 μžˆλŠ”μ§€, 그리고 이 쑰건이 λ§Œμ‘±λ˜μ§€ μ•ŠλŠ” 경우의 μ„±λŠ₯ μ €ν•˜μ— λŒ€ν•œ 보닀 심측적인 뢄석이 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ, μƒμˆ˜ 크기 지원이 μ—„κ²©ν•˜κ²Œ μœ μ§€λ˜λŠ” 'μ•ˆμ „ν•œ' μ˜μ—­μ„ λ„˜μ–΄μ„œλŠ” 경우의 μ„±λŠ₯ 변화에 λŒ€ν•œ μΆ”κ°€ 연ꡬ가 μš”κ΅¬λ©λ‹ˆλ‹€.
πŸ‘