haebom
Sign In
AllMem: A Memory-centric Recipe for Efficient Long-context Modeling
Created by
Haebom
Category
Empty
์ ์
Ziming Wang, Xiang Wang, Kailong Peng, Lang Qin, Juan Gabriel Kostelec, Christos Sourmpis, Axel Laborieux, Qinghai Guo
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ๊ธด ์ํ์ค ๋ชจ๋ธ๋ง์์ ๋ฐ์ํ๋ LLM์ ๊ณ์ฐ ๋ณต์ก์ฑ๊ณผ ๋ฉ๋ชจ๋ฆฌ ์ค๋ฒํค๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ฌ๋ผ์ด๋ฉ ์๋์ฐ ์ดํ ์ (SWA)๊ณผ ๋น์ ํ ํ ์คํธ ์์ ํ๋ จ(TTT) ๋ฉ๋ชจ๋ฆฌ ๋คํธ์ํฌ๋ฅผ ๊ฒฐํฉํ ํจ์จ์ ์ธ ํ์ด๋ธ๋ฆฌ๋ ์ํคํ ์ฒ์ธ AllMem์ ์ ์ํฉ๋๋ค. AllMem์ ๋ชจ๋ธ์ด ์ด์ฅ๊ธฐ ๋ฌธ๋งฅ์ ํจ๊ณผ์ ์ผ๋ก ์ฒ๋ฆฌํ๊ณ ์น๋ช ์ ์ธ ๋ง๊ฐ์ ์ํํ๋ฉฐ, ๊ณ์ฐ ๋ฐ ๋ฉ๋ชจ๋ฆฌ ๋ถ๋ด์ ์ค์ ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
๊ธฐ์กด LLM์ ์ฅ๊ธฐ ๋ฌธ๋งฅ ์ฒ๋ฆฌ ๋ฅ๋ ฅ ๋ถ์กฑ ๋ฐ ๋์ ๊ณ์ฐ/๋ฉ๋ชจ๋ฆฌ ์๊ตฌ๋ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํฉ๋๋ค.
โข
AllMem ์ํคํ ์ฒ๋ ๊ธฐ์กด ์ฌ์ ํ์ต๋ LLM์ ํจ์จ์ ์ผ๋ก ๋ณํํ ์ ์์ด ์ ์ฉ์ฑ์ด ๋์ต๋๋ค.
โข
4k ์๋์ฐ ๋ชจ๋ธ์ 37k LongBench์์ ๊ฑฐ์ ์์ค ์๋ ์ฑ๋ฅ์ ๋ณด์๊ณ , 8k ์๋์ฐ ๋ชจ๋ธ์ 128k ๋ฌธ๋งฅ์์ ๊ธฐ์กด ์ดํ ์ ๋ณด๋ค ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ฌ ํ๋ผ๋ฏธํฐํ๋ ๋ฉ๋ชจ๋ฆฌ์ ํจ์ฉ์ฑ์ ์ ์ฆํ์ต๋๋ค.
โข
(ํ๊ณ์ ๋๋ ํฅํ ๊ณผ์ ) AllMem ์ํคํ ์ฒ์ ์ต์ ์๋์ฐ ํฌ๊ธฐ ๋ฐ ๋ฉ๋ชจ๋ฆฌ ์ฉ๋ ๊ฒฐ์ , ๋ค์ํ LLM ์ํคํ ์ฒ์ ๋ํ ์ผ๋ฐํ ์ฑ๋ฅ ๊ฒ์ฆ ๋ฑ์ด ํฅํ ์ฐ๊ตฌ ๊ณผ์ ๋ก ๋จ์ต๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage