๋ณธ ๋
ผ๋ฌธ์ ๊ฐํํ์ต ๊ธฐ๋ฐ์ ๊ฒ์ฆ ๊ฐ๋ฅํ ๋ณด์(RLVR) ํ์ต ๋ฐฉ์์ด ๋ชจ๋ธ์ ์ถ๋ก ๊ณผ์ ์ ๋
ํนํ ํ๋์ ํน์ง์ ์ ๋ฐํ๋ค๋ ์ ์ ์ฃผ๋ชฉํ์ฌ, RLVR ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ํ์งํ๋ ์๋ก์ด ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค. ์ ์๋ Min-$k$NN Distance ํ์ง๊ธฐ๋ ํ๋ จ ์ค ๋
ธ์ถ๋ ํ๋กฌํํธ์ ๋ํ ๋ชจ๋ธ ์์ฑ ๊ฒฐ๊ณผ์ ๊ตฌ์กฐ์ ์๋ ด์ฑ์ ์ธก์ ํ์ฌ, ๊ธฐ์กด ๋ฐฉ๋ฒ๋ณด๋ค ํจ๊ณผ์ ์ผ๋ก RLVR ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ๊ตฌ๋ถํด๋
๋๋ค. ์คํ ๊ฒฐ๊ณผ, ์ด ๋ฐฉ๋ฒ์ RLVR ํ๋ จ ๋ฐ์ดํฐ๋ฅผ ๋ช
ํํ๊ฒ ์๋ณํ๋ฉฐ ๊ธฐ์กด์ ํ์ง ๊ธฐ๋ฒ๋ค์ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค.