Sign In

ThinkRouter: Efficient Reasoning via Routing Thinking between Latent and Discrete Spaces

Created by
  • Haebom
Category
Empty

์ €์ž

Xin Xu, Tong Yu, Xiang Chen, Haoliang Wang, Julian McAuley, Saayan Mitra

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ๊ธฐ์กด ์ž ์žฌ ๊ณต๊ฐ„ ์ถ”๋ก  ๋ฐฉ์‹์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด, ๋ชจ๋ธ์˜ ์ถ”๋ก  ์‹ ๋ขฐ๋„๋ฅผ ์ธ์ง€ํ•˜์—ฌ ์ถ”๋ก  ๋ฐฉ์‹์„ ๋™์ ์œผ๋กœ ์ „ํ™˜ํ•˜๋Š” ThinkRouter๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ThinkRouter๋Š” ๋ชจ๋ธ ์‹ ๋ขฐ๋„๊ฐ€ ๋‚ฎ์„ ๋•Œ๋Š” ๋ช…์‹œ์  ํ† ํฐ ๊ณต๊ฐ„์œผ๋กœ, ๋†’์„ ๋•Œ๋Š” ์ž ์žฌ ๊ณต๊ฐ„์œผ๋กœ ์ถ”๋ก ์„ ๋ผ์šฐํŒ…ํ•˜์—ฌ ํšจ์œจ์ ์ด๊ณ  ์ •ํ™•ํ•œ ์ถ”๋ก ์„ ์ˆ˜ํ–‰ํ•œ๋‹ค. ์‹คํ—˜ ๊ฒฐ๊ณผ, ThinkRouter๋Š” ๊ธฐ์กด ๋ฐฉ์‹ ๋Œ€๋น„ ์ •ํ™•๋„๋ฅผ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ค๊ณ  ์ƒ์„ฑ ๊ธธ์ด๋ฅผ ๋‹จ์ถ•์‹œํ‚ค๋Š” ์„ฑ๊ณผ๋ฅผ ๋ณด์˜€๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
์ž ์žฌ ๊ณต๊ฐ„ ์ถ”๋ก  ์‹œ ๋ฐœ์ƒํ•˜๋Š” ์ €์‹ ๋ขฐ๋„ ์Šคํ…์˜ ๋ˆ„์ ๊ณผ ๋…ธ์ด์ฆˆ ์ „ํŒŒ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ์ถ”๋ก  ์‹ ๋ขฐ๋„๋ฅผ ํ™œ์šฉํ•œ ๋™์  ๋ผ์šฐํŒ… ๋ฉ”์ปค๋‹ˆ์ฆ˜์˜ ํšจ๊ณผ์„ฑ์„ ์ž…์ฆํ–ˆ๋‹ค.
โ€ข
STEM ์ถ”๋ก  ๋ฐ ์ฝ”๋”ฉ ๋ฒค์น˜๋งˆํฌ์—์„œ ๋‹ค์–‘ํ•œ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์— ThinkRouter๋ฅผ ์ ์šฉํ•˜์—ฌ, ๊ธฐ์กด CoT, ๋ฌด์ž‘์œ„ ๋ผ์šฐํŒ…, ์ž ์žฌ ์ถ”๋ก  ๋Œ€๋น„ ๋†’์€ ์ •ํ™•๋„ ํ–ฅ์ƒ๊ณผ ์ƒ์„ฑ ๊ธธ์ด ๋‹จ์ถ•์ด๋ผ๋Š” ์‹ค์งˆ์ ์ธ ์ด์ ์„ ์ œ์‹œํ–ˆ๋‹ค.
โ€ข
ThinkRouter๋Š” ๋ช…์‹œ์  CoT์™€ ์ž ์žฌ ์ถ”๋ก ์˜ ์˜ค๋ฅ˜๋ฅผ ๋ณด์ •ํ•˜๊ณ , ๋ชจ๋ธ์˜ ์ „๋ฐ˜์ ์ธ ์‹ ๋ขฐ๋„๋ฅผ ๋‚ฎ์ถฐ ์ถ”๋ก  ์ข…๋ฃŒ ํ† ํฐ ์ƒ์„ฑ์„ ๊ฐ€์†ํ™”ํ•˜๋Š” ๋Šฅ๋ ฅ์„ ๋ณด์ธ๋‹ค.
๐Ÿ‘