Sign In

X-RAY: Mapping LLM Reasoning Capability via Formalized and Calibrated Probes

Created by
  • Haebom
Category
Empty

์ €์ž

Gao Tianxi, Cai Yufan, Yuan Yusi, Dong Jin Song

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ์ฒด๊ณ„์ ์œผ๋กœ ์ดํ•ดํ•˜๊ณ  ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•œ ์ƒˆ๋กœ์šด ์‹œ์Šคํ…œ 'X-RAY'๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. X-RAY๋Š” ์ œ์•ฝ ์กฐ๊ฑด ์ƒํ˜ธ์ž‘์šฉ, ์ถ”๋ก  ๊นŠ์ด, ํ•ด ๊ณต๊ฐ„ ๊ธฐํ•˜ํ•™ ๋“ฑ์˜ ํ˜•์‹์  ์†์„ฑ์„ ํ†ตํ•ด ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๊ตฌ์กฐ์ ์œผ๋กœ ๋ถ„์„ํ•˜๋ฉฐ, ์ด๋ฅผ ์œ„ํ•ด ํ˜•์‹ ๊ฒ€์ฆ๋œ ํƒ์นจ(probes)์„ ์ƒ์„ฑํ•˜๊ณ  ๋ณด์ •ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด LLM์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์— ๋Œ€ํ•œ ๊นŠ์ด ์žˆ๋Š” ํ†ต์ฐฐ์„ ์ œ๊ณตํ•˜๊ณ , ๊ธฐ์กด ํ‰๊ฐ€ ๋ฐฉ์‹์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
LLM์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์€ ๊ธฐ์กด์˜ ํƒœ์Šคํฌ ์ •ํ™•๋„ ๊ธฐ๋ฐ˜ ํ‰๊ฐ€๋งŒ์œผ๋กœ๋Š” ์ œ๋Œ€๋กœ ํŒŒ์•…ํ•˜๊ธฐ ์–ด๋ ค์šฐ๋ฉฐ, ๊ตฌ์กฐ์  ํŠน์„ฑ์— ๋”ฐ๋ผ ์‹œ์Šคํ…œ์ ์ธ ๋น„๋Œ€์นญ์„ฑ์„ ๋ณด์ž…๋‹ˆ๋‹ค.
โ€ข
LLM์€ ์ œ์•ฝ ์กฐ๊ฑด ๊ฐœ์„ ์—๋Š” ์ƒ๋Œ€์ ์œผ๋กœ ๊ฐ•ํ•˜์ง€๋งŒ, ํ•ด ๊ณต๊ฐ„ ๊ตฌ์กฐ ๋ณ€๊ฒฝ์—๋Š” ์ทจ์•ฝํ•œ ๊ฒฝํ–ฅ์ด ์žˆ์œผ๋ฉฐ, X-RAY๋Š” ์ด๋Ÿฌํ•œ ์ฐจ์ด๋ฅผ ๋ช…ํ™•ํžˆ ๊ตฌ๋ถ„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
โ€ข
์ œ์•ˆ๋œ ํ˜•์‹์  ํƒ์นจ์€ ๋ชจ๋ธ ๊ฐ„์˜ ๋ฏธ๋ฌ˜ํ•œ ์ถ”๋ก  ๋Šฅ๋ ฅ ์ฐจ์ด๋ฅผ ๋ฐํžˆ๊ณ , ๊ตฌ์กฐ์ ์œผ๋กœ ํ•ด์„ ๊ฐ€๋Šฅํ•œ ์‹คํŒจ ๋ชจ๋“œ๋ฅผ ๋“œ๋Ÿฌ๋‚ด์–ด ๋ชจ๋ธ ๊ฐœ๋ฐœ ๋ฐ ๊ฒ€์ฆ์— ๊ธฐ์—ฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
โ€ข
ํ˜•์‹์  ํƒ์นจ์„ ์ด์šฉํ•œ ํ‰๊ฐ€ ๋ฐ ํ›ˆ๋ จ ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ๋ฐ์ดํ„ฐ ์˜ค์—ผ ๋ฌธ์ œ์—์„œ ์ž์œ ๋กœ์šฐ๋ฉฐ, ์ถ”๋ก  ๋ชจ๋ธ์˜ ํ›ˆ๋ จ ๋ฐ ํ…Œ์ŠคํŠธ๋ฅผ ์ง€์›ํ•  ์ˆ˜ ์žˆ๋Š” ์ž ์žฌ๋ ฅ์„ ๊ฐ€์ง‘๋‹ˆ๋‹ค.
โ€ข
๋ณธ ์—ฐ๊ตฌ์—์„œ ์ œ์‹œ๋œ ์ถ”๋ก  ๋Šฅ๋ ฅ ๋ชจ๋ธ๋ง ๋ฐ ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก ์˜ ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ๊ณผ ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ์œผ๋กœ์˜ ํ™•์žฅ์„ฑ์ด ํ–ฅํ›„ ์—ฐ๊ตฌ ๊ณผ์ œ๊ฐ€ ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘