Sign In

M2A: Synergizing Mathematical and Agentic Reasoning in Large Language Models

์ž‘์„ฑ์ž
  • Haebom
์นดํ…Œ๊ณ ๋ฆฌ
Empty

์ €์ž

Junjian Wang, Xin Zhou, Qiran Xu, Kun Zhan

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์—์„œ ์ˆ˜ํ•™์  ์ถ”๋ก ๊ณผ ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ์ถ”๋ก ์˜ ๋ถˆ์ผ์น˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด M2A๋ผ๋Š” ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. M2A๋Š” ๋ชจ๋ธ ๋ณ‘ํ•ฉ์„ ํ†ตํ•ด ์ด ๋‘ ๊ฐ€์ง€ ์ถ”๋ก  ๋ฐฉ์‹์„ ์‹œ๋„ˆ์ง€ ํšจ๊ณผ๋ฅผ ๋‚ด๋„๋ก ํ†ตํ•ฉํ•˜๋ฉฐ, ํŠนํžˆ ์—์ด์ „ํŠธ ํ–‰๋™์— ์ค‘์š”ํ•œ ํŠน์ง• ๊ณต๊ฐ„์„ ์‹๋ณ„ํ•˜๊ณ  ์ˆ˜ํ•™์  ์ถ”๋ก  ๋Šฅ๋ ฅ๋งŒ์„ null space๋ฅผ ๋”ฐ๋ผ ์ฃผ์ž…ํ•˜์—ฌ ๊ธฐ์กด ์—์ด์ „ํŠธ ํ–‰๋™์„ ๊ต๋ž€ํ•˜์ง€ ์•Š๋„๋ก ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์ถ”๊ฐ€์ ์ธ ํ•™์Šต ์—†์ด ์ถ”๋ก  ๊ธธ์ด๋ฅผ ์กฐ์ ˆํ•  ์ˆ˜ ์žˆ๋Š” ์œ ์—ฐ์„ฑ์„ ์ œ๊ณตํ•˜๋ฉฐ, ์‹ค์ œ ์ฝ”๋”ฉ ์—์ด์ „ํŠธ ํ™˜๊ฒฝ์—์„œ ์ถ”๋ก  ๊นŠ์ด๋ฅผ ํ™•์žฅํ•˜๊ณ  ์„ฑ๋Šฅ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
LLM์˜ ์ˆ˜ํ•™์  ๋ฐ ์—์ด์ „ํŠธ ๊ธฐ๋ฐ˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํšจ๊ณผ์ ์œผ๋กœ ์œตํ•ฉํ•˜์—ฌ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋Š” ์ƒˆ๋กœ์šด ๋ชจ๋ธ ๋ณ‘ํ•ฉ ๊ธฐ๋ฒ•์„ ์ œ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค.
โ€ข
์ถ”๊ฐ€์ ์ธ ๋ชจ๋ธ ํ•™์Šต ์—†์ด๋„ ์ถ”๋ก  ๋Šฅ๋ ฅ๊ณผ ๊ธธ์ด๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์กฐ์ ˆํ•  ์ˆ˜ ์žˆ๋Š” ํŒŒ๋ผ๋ฏธํ„ฐ ๊ธฐ๋ฐ˜์˜ ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
โ€ข
๋ณธ ์—ฐ๊ตฌ์—์„œ ์ œ์•ˆ๋œ M2A๋Š” ํŠน์ • ์—์ด์ „ํŠธ ํ–‰๋™๊ณผ ์ˆ˜ํ•™์  ์ถ”๋ก  ๋Šฅ๋ ฅ์˜ ๊ท ํ˜•์„ ๋งž์ถ”๋Š” ๋ฐ ์ค‘์ ์„ ๋‘์—ˆ์œผ๋‚˜, ๋” ๋ณต์žกํ•˜๊ฑฐ๋‚˜ ๋‹ค์–‘ํ•œ ์œ ํ˜•์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ํ†ตํ•ฉํ•˜๋Š” ๋ฐ ๋Œ€ํ•œ ํ™•์žฅ์„ฑ ๋ฐ ์ž ์žฌ์  ์ถฉ๋Œ ๊ฐ€๋Šฅ์„ฑ์— ๋Œ€ํ•œ ์ถ”๊ฐ€์ ์ธ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘