haebom
Sign In
Caracal: Causal Architecture via Spectral Mixing
Created by
Haebom
Category
Empty
์ ์
Bingzheng Gan, Tianyi Zhang, Yusu Li, Jing Huang, Wei Shi, Yangkai Ding, Tao Yu
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ๊ธฐ์กด ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ๊ธด ์ํ์ค ์ฒ๋ฆฌ ์ ๋ฐ์ํ๋ ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ์ด์ฐจ์ ๋น์ฉ๊ณผ ์์น ์ธ์ฝ๋ฉ์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํ ์๋ก์ด ์ ๊ฒฝ๋ง ๊ตฌ์กฐ์ธ Caracal์ ์ ์ํฉ๋๋ค. Caracal์ ํ๋ผ๋ฏธํฐ ํจ์จ์ ์ธ O(L log(L)) ๋ณต์ก๋๋ฅผ ๊ฐ์ง๋ Multi-Head Fourier (MHF) ๋ชจ๋์ ํตํด ์ดํ ์ ์ ๋์ฒดํ๋ฉฐ, ๊ณ ์ ํธ๋ฆฌ์ ๋ณํ(FFT)์ ํ์ฉํ์ฌ ์ํ์ค ๋ฏน์ฑ์ ์ํํฉ๋๋ค. ๋ํ, ์ฃผํ์ ์์ญ์์์ ์ธ๊ณผ์ ๋ง์คํน ๊ธฐ๋ฒ์ ์ ์ฉํ์ฌ ํธ๋ฆฌ์ ๊ธฐ๋ฐ ์์ฑ ๋ชจ๋ธ์ ์ฃผ์ ๊ณผ์ ์๋ ์๊ธฐํ๊ท(autoregressive) ๋ฅ๋ ฅ์ ํ๋ณดํ์์ผ๋ฉฐ, ํ์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ฐ์ฐ์๋ฅผ ์ฌ์ฉํ์ฌ ํ๋์จ์ด ์ข ์์ฑ ์์ด ๋์ ์ด์์ฑ์ ๋ณด์ฅํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
Caracal์ FFT๋ฅผ ํ์ฉํ์ฌ ๊ธด ์ํ์ค ๋ชจ๋ธ๋ง์ ํ์ฅ์ฑ์ ๊ฐ์ ํ๊ณ ๊ณ์ฐ ๋น์ฉ์ ํจ์จ์ ์ผ๋ก ๊ด๋ฆฌํ ์ ์๋ ์๋ก์ด ์ํคํ ์ฒ๋ฅผ ์ ์ํฉ๋๋ค.
โข
์ฃผํ์ ์์ญ์์์ ์ธ๊ณผ์ ๋ง์คํน ๊ธฐ๋ฒ์ ํตํด ๊ธฐ์กด ํธ๋ฆฌ์ ๊ธฐ๋ฐ ๋ชจ๋ธ์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ณ ์์ฑ ๋ชจ๋ธ๋ก์์ ํ์ฉ ๊ฐ๋ฅ์ฑ์ ๋์์ต๋๋ค.
โข
ํ์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ฐ์ฐ์ ์ฌ์ฉ์ผ๋ก ํ๋์จ์ด ์์กด์ฑ์ ์ ๊ฑฐํ์ฌ ๋ชจ๋ธ์ ๋ฐฐํฌ ์ฉ์ด์ฑ์ ํฌ๊ฒ ํฅ์์์ผฐ์ต๋๋ค.
โข
Transformer ๋ฐ SSM ๊ธฐ๋ฐ ๋ชจ๋ธ๊ณผ ๋น๊ตํ์ ๋ ๊ฒฝ์๋ ฅ ์๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ์ง๋ง, ๋ ๋ณต์กํ๊ฑฐ๋ ๋ค์ํ ์ข ๋ฅ์ ์ํ์ค ๋ฐ์ดํฐ์ ๋ํ ์ถ๊ฐ์ ์ธ ๊ฒ์ฆ ๋ฐ ์ต์ ํ ์ฐ๊ตฌ๊ฐ ํ์ํ ์ ์์ต๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage