Sign In

Less Is More: Fast and Accurate Reasoning with Cross-Head Unified Sparse Attention

Created by
  • Haebom
Category
Empty

μ €μž

Lijie Yang, Zhihao Zhang, Arti Jain, Shijie Cao, Baihong Yuan, Yiwei Chen, Zhihao Jia, Ravi Netravali

πŸ’‘ κ°œμš”

λ³Έ 논문은 λŒ€κ·œλͺ¨ μΆ”λ‘  λͺ¨λΈμ˜ ν…ŒμŠ€νŠΈ μ‹œκ°„ μŠ€μΌ€μΌλ§μœΌλ‘œ μΈν•œ 높은 μ—°μ‚° μ˜€λ²„ν—€λ“œλ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ "LessIsMore"λΌλŠ” ν›ˆλ ¨-μ—†λŠ” ν¬μ†Œ μ–΄ν…μ…˜ λ©”μ»€λ‹ˆμ¦˜μ„ μ œμ•ˆν•©λ‹ˆλ‹€. 이 방법은 μΆ”λ‘  μ‹œ 토큰 μ€‘μš”λ„κ°€ μ—¬λŸ¬ μ–΄ν…μ…˜ ν—€λ“œμ— 걸쳐 보편적이고 μ•ˆμ •μ μ΄λΌλŠ” 톡찰을 λ°”νƒ•μœΌλ‘œ, ν—€λ“œ κ°„ ν†΅μΌλœ 토큰 선택과 졜근 μ»¨ν…μŠ€νŠΈ 보쑴을 톡해 μ „μ—­μ μœΌλ‘œ μΌκ΄€λœ 토큰 집합을 κ΅¬μΆ•ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 정확도λ₯Ό μœ μ§€ν•˜κ±°λ‚˜ ν–₯μƒμ‹œν‚€λ©΄μ„œλ„ 훨씬 적은 수의 토큰에 주의λ₯Ό κΈ°μšΈμ—¬ μΆ”λ‘  속도λ₯Ό 크게 κ°œμ„ ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
κΈ°μ‘΄ ν¬μ†Œ μ–΄ν…μ…˜ λ°©μ‹μ˜ 정확도 μ €ν•˜ 문제λ₯Ό κ·Ήλ³΅ν•˜λ©°, ν›ˆλ ¨ 없이도 μ„±λŠ₯ ν–₯상을 λ‹¬μ„±ν•©λ‹ˆλ‹€.
β€’
μΆ”λ‘  κ³Όμ • μ „λ°˜μ— 걸쳐 μ€‘μš”ν•œ 토큰 선택이 μ „μ—­μ μœΌλ‘œ μΌκ΄€λ˜κ²Œ μœ μ§€λ  수 μžˆμŒμ„ μž…μ¦ν•©λ‹ˆλ‹€.
β€’
μž₯κΈ° μΆ”λ‘ μ—μ„œ λͺ¨λΈμ˜ νš¨μœ¨μ„±κ³Ό 정확도λ₯Ό λ™μ‹œμ— κ°œμ„ ν•  수 μžˆλŠ” μƒˆλ‘œμš΄ λ°©μ•ˆμ„ μ œμ‹œν•©λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬μ—μ„œ μ œμ‹œλœ 토큰 μ€‘μš”λ„μ˜ 'μ•ˆμ •μ„±' 가정이 λͺ¨λ“  μ’…λ₯˜μ˜ μΆ”λ‘  μž‘μ—…μ΄λ‚˜ λͺ¨λΈ μ•„ν‚€ν…μ²˜μ— λŒ€ν•΄ 항상 μœ νš¨ν•œμ§€μ— λŒ€ν•œ 좔가적인 검증이 ν•„μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€.
πŸ‘