haebom
Sign In
Spend Search Where It Pays: Value-Guided Structured Sampling and Optimization for Generative Recommendation
Created by
Haebom
Category
Empty
์ ์
Jie Jiang, Yangru Huang, Zeyu Wang, Changping Wang, Yuling Xiong, Jun Zhang, Huan Yu
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ๊ธฐ์กด ์์ฑ ์ถ์ฒ ๋ชจ๋ธ์ ํ๋ฅ -๋ณด์ ๋ถ์ผ์น ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด V-STAR๋ผ๋ ์๋ก์ด ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค. V-STAR๋ Value-Guided Efficient Decoding (VED)๊ณผ Sibling-GRPO๋ฅผ ํตํด ํ์ ํจ์จ์ฑ์ ๋์ด๊ณ ์์ฌ ๊ฒฐ์ ์ ์ง์ค๋ ํ์ต ์ ํธ๋ฅผ ์ ๊ณตํจ์ผ๋ก์จ ์ถ์ฒ์ ์ ํ์ฑ๊ณผ ๋ค์์ฑ์ ํฅ์์ํต๋๋ค. ์คํ ๊ฒฐ๊ณผ, V-STAR๋ ์ต์ ๊ธฐ์ ๋๋น ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ์์ต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
๊ฐํํ์ต ๊ธฐ๋ฐ ์์ฑ ์ถ์ฒ ๋ชจ๋ธ์ ํ์ ๋ถ์กฑ ๋ฐ ๋ณด์ ์์ถ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํด๊ฒฐํ์ต๋๋ค.
โข
ํธ๋ฆฌ ๊ตฌ์กฐ ๊ธฐ๋ฐ ์ํ๋ง๊ณผ ์๋์ ์ฅ์ ๊ณ์ฐ์ ํตํด ์ถ์ฒ ์์คํ ์ ํจ์จ์ฑ๊ณผ ์ฑ๋ฅ์ ๊ฐ์ ํ์ต๋๋ค.
โข
๋ณต์กํ ํธ๋ฆฌ ํ์ ๊ณผ์ ์ ๋ ํจ์จ์ ์ผ๋ก ์ํํ ์ ์๋ ๋ฐฉ๋ฒ์ ์ ์ํ์ต๋๋ค.
โข
์ ์๋ ํ๋ ์์ํฌ์ ๋ณต์ก์ฑ๊ณผ ์ค์ ์๋น์ค ์ ์ฉ ์์ ํ์ฅ์ฑ ๋ฐ ์ถ๊ฐ์ ์ธ ์ต์ ํ ๋ฐฉ์์ ๋ํ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage