haebom
Sign In
EvoSpec: Evolving Speculative Decoding via Real-Time Vocabulary and Parameter Adaptation
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Shuyu Zhang, Lingfeng Pan, Qicheng Wang, Yaqi Shi, Yueyang Tan, Ruyu Yan, Jiaqi Chen, Lixing Du, Lu Wang
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM) ์ถ๋ก ์๋ ํฅ์์ ์ํ ํฌ๊ธฐ์ ๋์ฝ๋ฉ(speculative decoding)์ ๋ณ๋ชฉ ํ์์ธ ์ถ๋ ฅ ํฌ์ ๊ณ์ธต ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ ํฉ๋๋ค. ์ด๋ฅผ ์ํด ๋์ ์ดํ ๋ฐ ๋งค๊ฐ๋ณ์ ์ ์์ ํตํด ๋๋ํํธ ๋ชจ๋ธ์ ์ค์๊ฐ์ผ๋ก ๋ฐ์ ์ํค๋ EvoSpec ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค. EvoSpec์ ์ปจํ ์คํธ ๊ธฐ๋ฐ ๋ฉ์ปค๋์ฆ๊ณผ ๊ฒฝ๋ ์จ๋ผ์ธ ์ ๋ ฌ ์ ๋ต์ ํ์ฉํ์ฌ ์ ๋ฌธ ๋๋ฉ์ธ์์์ ์ฑ๋ฅ ์ ํ ์์ด ๊ธฐ์กด ๋ฐฉ๋ฒ๋ก ์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ณ ํจ์จ์ฑ์ ๋์์ต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
๋์ ์ ์์ ํตํ ํฌ๊ธฐ์ ๋์ฝ๋ฉ ์ฑ๋ฅ ํฅ์:
EvoSpec์ ๋๋ฉ์ธ ๋ณ๊ฒฝ์ด๋ ์ฃผ์ ์ ํ ์ ๋ฐ์ํ๋ ๋์ ๋ถํฌ ๋ณํ์ ์ค์๊ฐ์ผ๋ก ์ ์ํ์ฌ ํฌ๊ธฐ์ ๋์ฝ๋ฉ์ ์์ฉ๋ฅ ์ ํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํฉ๋๋ค.
โข
ํจ์จ์ ์ธ ์ฅ๊ธฐ ๋ฏธ์ฌ์ฉ ํ ํฐ ์ฒ๋ฆฌ:
์๋ฏธ๋ก ์ ๋ฐ ํต๊ณ์ ์ธ๋ฑ์ฑ์ ํ์ฉํ์ฌ ํจ์จ์ ์ผ๋ก ์ฅ๊ธฐ ๋ฏธ์ฌ์ฉ ํ ํฐ์ ๊ฒ์ํจ์ผ๋ก์จ, ๋๋ํํธ ๋ชจ๋ธ์ ์์ธก ๋ฅ๋ ฅ์ ํฅ์์ํต๋๋ค.
โข
ํ๊ณ์ :
์ ์๋ ๊ฒฝ๋ ์จ๋ผ์ธ ์ ๋ ฌ ์ ๋ต์ ๊ฒฝ์ฐ, ๋งค์ฐ ๋ณต์กํ๊ฑฐ๋ ๊ธ๊ฒฉํ ๋ถํฌ ๋ณํ๋ฅผ ๋ณด์ด๋ ๊ทน๋จ์ ์ธ ์ํฉ์์๋ ์ถ๊ฐ์ ์ธ ์ต์ ํ๊ฐ ํ์ํ ์ ์์ผ๋ฉฐ, ์ค์ ์๋น์ค ํ๊ฒฝ์์์ ๋๊ท๋ชจ ํ ์คํธ๋ฅผ ํตํ ์ถ๊ฐ ๊ฒ์ฆ์ด ํ์ํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage