haebom
Sign In
MemFly: On-the-Fly Memory Optimization via Information Bottleneck
Created by
Haebom
Category
Empty
์ ์
Zhenyuan Zhang, Xianzhang Jia, Zhiqin Yang, Zhenbo Song, Wei Xue, Sirui Han, Yike Guo
๐ก ๊ฐ์
๋ณธ ์ฐ๊ตฌ๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM) ์์ด์ ํธ์ ์ฅ๊ธฐ ๊ธฐ์ต ์ฑ๋ฅ์ ํฅ์์ํค๊ธฐ ์ํด ์ ๋ณด ๋ณ๋ชฉ(Information Bottleneck) ์๋ฆฌ์ ๊ธฐ๋ฐํ MemFly ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค. MemFly๋ ์์ถ ์ ๋ฐ์ํ๋ ์ ๋ณด ์์ค์ ์ต์ํํ๊ณ ๊ฒ์ ์ ๊ด๋ จ์ฑ ์ ๋ณด๋ฅผ ์ต๋ํํ๋๋ก ์ค๊ณ๋์์ผ๋ฉฐ, ์ด๋ฅผ ํตํด ์จ๋๋งจ๋(on-the-fly) ๋ฉ๋ชจ๋ฆฌ ์ต์ ํ๋ฅผ ๋ฌ์ฑํฉ๋๋ค. ์ ์๋ ํ์ด๋ธ๋ฆฌ๋ ๊ฒ์ ๋ฉ์ปค๋์ฆ์ ์๋ฏธ๋ก ์ , ๊ธฐํธ์ , ์์ํ์ ์ ๋ณด๋ฅผ ํตํฉํ๊ณ ๋ฐ๋ณต์ ์ธ ์ ์ ๋ฅผ ํตํด ๋ณต์กํ ๋ค๋จ๊ณ ์ฟผ๋ฆฌ์ ํจ๊ณผ์ ์ผ๋ก ๋์ํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
LLM์ ์ฅ๊ธฐ ๊ธฐ์ต ๊ด๋ฆฌ์์ ๋ฐ์ํ๋ ์ ๋ณด ์์ถ๊ณผ ์ ํํ ๊ฒ์ ๊ฐ์ ์์ถฉ ๊ด๊ณ๋ฅผ ์ ๋ณด ๋ณ๋ชฉ ์ด๋ก ์ผ๋ก ํด๊ฒฐํ ์ ์๋ ๊ฐ๋ฅ์ฑ์ ์ ์ํฉ๋๋ค.
โข
MemFly๋ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ก ๋๋น ๋ฉ๋ชจ๋ฆฌ ์ผ๊ด์ฑ, ์๋ต ์ถฉ์ค๋, ์ ํ๋ ์ธก๋ฉด์์ ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ด๋ฉฐ, ๋ณต์กํ ๋ค๋จ๊ณ ์ฟผ๋ฆฌ ์ฒ๋ฆฌ ๋ฅ๋ ฅ์ ํฌ๊ฒ ํฅ์์ํต๋๋ค.
โข
์ ์๋ ํ๋ ์์ํฌ์ ํ์ต ๋ฐ ์ถ๋ก ์ ๊ณ์ฐ ๋ณต์ก์ฑ์ด๋ ํ์ฅ์ฑ์ ๋ํ ์ถ๊ฐ์ ์ธ ๋ถ์์ด ํ์ํ๋ฉฐ, ์ค์ ์ ์ฉ ํ๊ฒฝ์์์ ํจ์จ์ฑ ๊ฒ์ฆ์ด ์๊ตฌ๋ฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage