Sign In

Predicting LLM Output Length via Entropy-Guided Representations

Created by
  • Haebom
Category
Empty

์ €์ž

Huanyi Xie, Yubin Chen, Liangyu Wang, Lijie Hu, Di Wang

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM) ์„œ๋น™ ๋ฐ ๊ฐ•ํ™”ํ•™์Šต(RL) ์ƒ˜ํ”Œ๋ง์—์„œ ๋ฐœ์ƒํ•˜๋Š” ์‹œํ€€์Šค ๊ธธ์ด์˜ ๊ธด ๊ผฌ๋ฆฌ ๋ถ„ํฌ๋กœ ์ธํ•œ ํŒจ๋”ฉ์œผ๋กœ ์ธํ•œ ์ปดํ“จํŒ… ๋‚ญ๋น„๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ ์ž ํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ ๋ณด์กฐ ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ์˜ˆ์ธก ๋ฐฉ์‹์€ ๋†’์€ ์˜ค๋ฒ„ํ—ค๋“œ์™€ ๋‚ฎ์€ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ, ๊ทธ๋ฆฌ๊ณ  ํ™•๋ฅ ์  ์ƒ˜ํ”Œ๋ง ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ์˜ ํ•œ๊ณ„๋ฅผ ๊ฐ€์ง‘๋‹ˆ๋‹ค. ์ด์— ๋ณธ ์—ฐ๊ตฌ์—์„œ๋Š” LLM์˜ ๋‚ด๋ถ€ ์€๋‹‰ ์ƒํƒœ๋ฅผ ์žฌํ™œ์šฉํ•˜๋Š” ํšจ์œจ์ ์ธ ๊ธธ์ด ์˜ˆ์ธก ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ๊ธฐ์กด ๋ฐฉ๋ฒ• ๋Œ€๋น„ ๋›ฐ์–ด๋‚œ ์ •ํ™•์„ฑ๊ณผ ๋‚ฎ์€ ๋น„์šฉ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
LLM ์„œ๋น™ ์‹œ ๋ฐœ์ƒํ•˜๋Š” ํŒจ๋”ฉ์œผ๋กœ ์ธํ•œ ์ปดํ“จํŒ… ๋‚ญ๋น„๋ฅผ ์ค„์—ฌ ํšจ์œจ์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
โ€ข
์ œ์•ˆ๋œ EGTP์™€ PLP ๊ธฐ๋ฒ•์€ ๋†’์€ ์ •ํ™•๋„๋กœ ์ •์  ๋ฐ ๋™์  ๊ธธ์ด ์˜ˆ์ธก์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋ฉฐ, ํŠนํžˆ ํ™•๋ฅ ์  ์ƒ์„ฑ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ๋„ ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค.
โ€ข
ForeLen ๋ฒค์น˜๋งˆํฌ ๊ตฌ์ถ•์€ LLM ๊ธธ์ด ์˜ˆ์ธก ๋ถ„์•ผ์˜ ์—ฐ๊ตฌ ๋ฐ ํ‰๊ฐ€๋ฅผ ์œ„ํ•œ ์ค‘์š”ํ•œ ๊ธฐ๋ฐ˜์„ ๋งˆ๋ จํ–ˆ์Šต๋‹ˆ๋‹ค.
โ€ข
์ œ์•ˆ๋œ ๋ฐฉ๋ฒ•๋ก ์˜ ์ ์šฉ ๊ฐ€๋Šฅ ๋ฒ”์œ„๋ฅผ ๋”์šฑ ๋„“ํžˆ๊ณ , ๋‹ค์–‘ํ•œ LLM ์•„ํ‚คํ…์ฒ˜ ๋ฐ ํƒœ์Šคํฌ์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ์ถ”๊ฐ€์ ์œผ๋กœ ๊ฒ€์ฆํ•  ํ•„์š”๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘