Sign In

A Mathematical Explanation of Transformers

Created by
  • Haebom
Category
Empty

μ €μž

Xue-Cheng Tai, Hao Liu, Lingfeng Li, Raymond H. Chan

πŸ’‘ κ°œμš”

λ³Έ 논문은 트랜슀포머 μ•„ν‚€ν…μ²˜λ₯Ό κ΅¬μ‘°ν™”λœ 적뢄-λ―ΈλΆ„ λ°©μ •μ‹μ˜ μ΄μ‚°ν™”λ‘œ μ„€λͺ…ν•˜λŠ” μƒˆλ‘œμš΄ 연속 ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. 이 ν”„λ ˆμž„μ›Œν¬λŠ” μ…€ν”„ μ–΄ν…μ…˜ λ©”μ»€λ‹ˆμ¦˜μ„ λΉ„κ΅­μ†Œ 적뢄 μ—°μ‚°μžλ‘œ, λ ˆμ΄μ–΄ μ •κ·œν™”λ₯Ό μ‹œκ°„ 의쑴적 μ œμ•½ 쑰건에 λŒ€ν•œ 투영으둜 μžμ—°μŠ€λŸ½κ²Œ μ„€λͺ…ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 μ–΄ν…μ…˜, ν”Όλ“œν¬μ›Œλ“œ λ ˆμ΄μ–΄, μ •κ·œν™” λ“± 트랜슀포머의 핡심 ꡬ성 μš”μ†Œλ₯Ό 톡합적이고 해석 κ°€λŠ₯ν•œ λ°©μ‹μœΌλ‘œ 이해할 수 μžˆλŠ” κΈ°λ°˜μ„ μ œκ³΅ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
트랜슀포머 ꡬ쑰와 μž‘λ™ 방식을 연속 μˆ˜ν•™ λͺ¨λΈλ§μ˜ κ΄€μ μ—μ„œ 깊이 있게 이해할 수 μžˆλŠ” 이둠적 κΈ°λ°˜μ„ μ œμ‹œν•©λ‹ˆλ‹€.
β€’
μ–΄ν…μ…˜, λ ˆμ΄μ–΄ μ •κ·œν™”μ™€ 같은 핡심 λ©”μ»€λ‹ˆμ¦˜μ„ μˆ˜ν•™μ μœΌλ‘œ λͺ…ν™•ν•˜κ²Œ ν•΄μ„ν•¨μœΌλ‘œμ¨ μ•„ν‚€ν…μ²˜ 섀계 및 뢄석에 μƒˆλ‘œμš΄ λ°©ν–₯을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
ν˜„μž¬μ˜ 이둠적 뢄석을 λ„˜μ–΄ 토큰 μΈλ±μŠ€μ™€ νŠΉμ§• 차원 λͺ¨λ‘μ—μ„œ 전체 트랜슀포머 연산을 연속 μ˜μ—­μ— μž„λ² λ”©ν•˜μ—¬ 더 κΉŠμ€ 이둠적 톡찰λ ₯을 μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
μ œμ•ˆλœ ν”„λ ˆμž„μ›Œν¬κ°€ μ‹€μ œ 트랜슀포머 λͺ¨λΈμ˜ νš¨μœ¨μ„±μ΄λ‚˜ μ„±λŠ₯을 μ§μ ‘μ μœΌλ‘œ ν–₯μƒμ‹œν‚€λŠ”μ§€λŠ” μΆ”κ°€ 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘