Sign In

Detecting RLVR Training Data via Structural Convergence of Reasoning

Created by
  • Haebom
Category
Empty

์ €์ž

Hongbo Zhang, Yue Yang, Jianhao Yan, Guangsheng Bao, Yue Zhang, Yue Zhang

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜์˜ ๊ฒ€์ฆ ๊ฐ€๋Šฅํ•œ ๋ณด์ƒ(RLVR) ํ•™์Šต ๋ฐฉ์‹์ด ๋ชจ๋ธ์˜ ์ถ”๋ก  ๊ณผ์ •์— ๋…ํŠนํ•œ ํ–‰๋™์  ํŠน์ง•์„ ์œ ๋ฐœํ•œ๋‹ค๋Š” ์ ์— ์ฃผ๋ชฉํ•˜์—ฌ, RLVR ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ํƒ์ง€ํ•˜๋Š” ์ƒˆ๋กœ์šด ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์ œ์•ˆ๋œ Min-$k$NN Distance ํƒ์ง€๊ธฐ๋Š” ํ›ˆ๋ จ ์ค‘ ๋…ธ์ถœ๋œ ํ”„๋กฌํ”„ํŠธ์— ๋Œ€ํ•œ ๋ชจ๋ธ ์ƒ์„ฑ ๊ฒฐ๊ณผ์˜ ๊ตฌ์กฐ์  ์ˆ˜๋ ด์„ฑ์„ ์ธก์ •ํ•˜์—ฌ, ๊ธฐ์กด ๋ฐฉ๋ฒ•๋ณด๋‹ค ํšจ๊ณผ์ ์œผ๋กœ RLVR ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ๊ตฌ๋ถ„ํ•ด๋ƒ…๋‹ˆ๋‹ค. ์‹คํ—˜ ๊ฒฐ๊ณผ, ์ด ๋ฐฉ๋ฒ•์€ RLVR ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ๋ช…ํ™•ํ•˜๊ฒŒ ์‹๋ณ„ํ•˜๋ฉฐ ๊ธฐ์กด์˜ ํƒ์ง€ ๊ธฐ๋ฒ•๋“ค์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
RLVR ํ•™์Šต ๋ฐฉ์‹์€ ๋ชจ๋ธ์˜ ์ƒ์„ฑ ๊ฒฐ๊ณผ์— "์ˆ˜๋ ด์„ฑ"์ด๋ผ๋Š” ํŠน์ง•์„ ๋ถ€์—ฌํ•˜๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํƒ์ง€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
โ€ข
Min-$k$NN Distance๋Š” ๋ชจ๋ธ์˜ ๋‚ด๋ถ€ ์ •๋ณด๋ฅผ ์š”๊ตฌํ•˜์ง€ ์•Š๋Š” ๋ธ”๋ž™๋ฐ•์Šค ํƒ์ง€๊ธฐ๋กœ, ๋‹ค์–‘ํ•œ RLVR ํ•™์Šต ๋ชจ๋ธ์— ์ ์šฉ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
โ€ข
๋ณธ ์—ฐ๊ตฌ๋Š” RLVR ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ํƒ์ง€์— ์ดˆ์ ์„ ๋งž์ถ”๊ณ  ์žˆ์œผ๋ฉฐ, ๋‹ค๋ฅธ ์ข…๋ฅ˜์˜ ๋ฐ์ดํ„ฐ ์˜ค์—ผ์ด๋‚˜ ํ›ˆ๋ จ ๋ฐฉ์‹์— ๋Œ€ํ•œ ํƒ์ง€ ๋ฐฉ๋ฒ•์€ ์ถ”๊ฐ€ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
๐Ÿ‘