haebom
Sign In
Memory-Efficient Looped Transformer: Decoupling Compute from Memory in Looped Language Models
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Victor Conchello Vendrell, Arnau Padres Masdemont, Niccol
o Grillo, Jordi Ros-Giralt, Arash Behboodi, Fabio Valerio Massoli
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ์ํ ์ธ์ด ๋ชจ๋ธ(LoopLM)์ ์ถ๋ก ๊น์ด๊ฐ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ์ ํ์ ์ผ๋ก ์ฆ๊ฐ์์ผ ํ์ฅ์ฑ์ ์ ์ฝ์ ์ค๋ค๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ ํฉ๋๋ค. ์ด๋ฅผ ์ํด ์ ์๋ Memory-Efficient Looped Transformer (MELT)๋ ๋ ์ด์ด๋ณ๋ก ๋จ์ผ KV ์บ์๋ฅผ ๊ณต์ ํ๊ณ ํ์ต ๊ฐ๋ฅํ ๊ฒ์ดํ ๋ฉ์ปค๋์ฆ์ผ๋ก ์ ๋ฐ์ดํธํ์ฌ ์ถ๋ก ๊น์ด์ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ๋ถ๋ฆฌํฉ๋๋ค. MELT๋ ๋ ๋จ๊ณ์ ์ฒญํฌ ๋จ์ ํ๋ จ ์ ์ฐจ๋ฅผ ํตํด ์์ ์ ์ผ๋ก ํ๋ จ๋๋ฉฐ, ์คํ ๊ฒฐ๊ณผ Ouro์ ๊ฐ์ ๊ธฐ์กด ๋ชจ๋ธ๋ณด๋ค ๋น์ทํ ํฌ๊ธฐ์ LLM๊ณผ ์ ์ฌํ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ์ ์งํ๋ฉด์๋ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
์ถ๋ก ๊น์ด์ ๋ฉ๋ชจ๋ฆฌ ์๋น๋ฅผ ๋ถ๋ฆฌํ์ฌ ์ํ ์ธ์ด ๋ชจ๋ธ์ ํ์ฅ์ฑ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํฉ๋๋ค.
โข
๊ฒฝ๋์ ํ์ฒ๋ฆฌ ํ๋ จ ์ ์ฐจ๋ง์ผ๋ก๋ ๊ธฐ์กด ๋ชจ๋ธ ๋๋น ๊ฒฝ์๋ ฅ ์๋ ์ฑ๋ฅ์ ๋ฌ์ฑํฉ๋๋ค.
โข
ํ์ต ๊ฐ๋ฅํ ๊ฒ์ดํ ๋ฉ์ปค๋์ฆ์ด KV ์บ์ ์ ๋ฐ์ดํธ๋ฅผ ์ ์ดํ๋ ๋ฐฉ์์ ๋ณต์ก์ฑ๊ณผ ํ์ต ์์ ์ฑ์ ๋ํ ์ถ๊ฐ์ ์ธ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage