haebom
Sign In
Context Pruning for Coding Agents via Multi-Rubric Latent Reasoning
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Jingjing Wang, Xiwen Chen, Wenhui Zhu, Huayu Li, Zhengxiao He, Feiyang Cai, Ana S. Carreon-Rascon, Xuanzhao Dong, Feng Luo
๐ก ๊ฐ์
LLM ๊ธฐ๋ฐ ์ฝ๋ฉ ์์ด์ ํธ๋ ์ฝ๋ ์ ์ฅ์ ํ์ผ์ ์ฝ๋ ๋ฐ ์๋นํ ํ ํฐ ์์ฐ์ ์ฌ์ฉํ์ง๋ง, ์ด ์ค ๋ง์ ๋ถ๋ถ์ด ์ค์ ์์ ๊ณผ ๊ด๋ จ์ด ์์ต๋๋ค. ๊ธฐ์กด์ ํ์ต ๊ธฐ๋ฐ ํ๋ฃจ๋๋ ๋จ์ผ ๋ชฉํ ์ํ์ค ๋ ์ด๋ธ๋ฌ๋ฅผ ์ฌ์ฉํ์ฌ ์ฝ๋ ๊ด๋ จ์ฑ์ ํ๋์ ์ ์๋ก ์์ถํ๋๋ฐ, ์ด๋ ๋ค์ํ ์ฝ๋ ๊ด๋ จ์ฑ ํจํด์ ํ๋์ ๋ชจ๋ธ๋ง ๋ณ๋ชฉ์ผ๋ก ๋ง๋ค ์ ์์ต๋๋ค. ๋ณธ ๋ ผ๋ฌธ์ ์ด๋ฌํ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด ์ฝ๋ ๊ด๋ จ์ฑ์ ์๋ฏธ๋ก ์ ์ฆ๊ฑฐ์ ์์กด์ฑ ์ง์์ด๋ผ๋ ๋ ๊ฐ์ง ํด์ ๊ฐ๋ฅํ ํ์ง ์ฐจ์์ผ๋ก ๋ถํดํ๊ณ , ๊ฐ ์ฐจ์์ ์ ์ฉ CRF๋ก ๋ชจ๋ธ๋งํ๋ LaMR (Latent Multi-Rubric)์ด๋ผ๋ ๊ตฌ์กฐํ๋ ํ๋ฃจ๋ ํ๋ ์์ํฌ๋ฅผ ์ ์ํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
LaMR์ ์ฝ๋ ๊ด๋ จ์ฑ์ ์๋ฏธ๋ก ์ ์คํฌ๊ณผ ๊ตฌ์กฐ์ ์ง์ ๋ผ์ธ ๋ฑ ์ด์ง์ ์ธ ์ ์ง ํจํด์ ๋ถ๋ฆฌํ์ฌ ๋ ํจ๊ณผ์ ์ผ๋ก ๋ชจ๋ธ๋งํ ์ ์์ต๋๋ค.
โข
AST ๊ธฐ๋ฐ ํ๋ก๊ทธ๋จ ๋ถ์์ ํตํด ์ถ๊ฐ์ ์ธ ์ฃผ์ ๋น์ฉ ์์ด ๋ค์ค ๋ฃจ๋ธ๋ฆญ ๋ ์ด๋ธ์ ์์ฑํ๊ณ ๊ธฐ์กด ํ์ต ๋ฐ์ดํฐ๋ฅผ ๋๋ ธ์ด์งํจ์ผ๋ก์จ ํ๋ฃจ๋ ์ฑ๋ฅ์ ํฅ์์ํต๋๋ค.
โข
LaMR์ ๊ธฐ์กด์ ๋จ์ผ ๋ชฉํ ํ๋ฃจ๋๋ณด๋ค ๋ฐ์ด๋๋ฉฐ, ํ ํฐ ์ ๊ฐ๊ณผ ์ ํ๋ ํฅ์ ์ธก๋ฉด์์ ์ ์๋ฏธํ ์ฑ๋ฅ ๊ฐ์ ์ ๋ณด์ ๋๋ค.
โข
์ผ๋ถ ๊ฒฝ์ฐ ์ฑ๋ฅ ์ ํ๊ฐ ๋ฐ์ํ ์ ์์ผ๋ฉฐ, ํนํ ๋ณต์กํ๊ฑฐ๋ ์์ธกํ๊ธฐ ์ด๋ ค์ด ์ฝ๋ ๊ตฌ์กฐ์ ๋ํ ์ถ๊ฐ์ ์ธ ์ฐ๊ตฌ๊ฐ ํ์ํ ์ ์์ต๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage