Sign In

Why Do Multilingual Reasoning Gaps Emerge in Reasoning Language Models?

Created by
  • Haebom
Category
Empty

์ €์ž

Deokhyung Kang, Seonjeong Hwang, Daehui Kim, Hyounghun Kim, Gary Geunbae Lee

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ์—ฐ๊ตฌ๋Š” ๋‹ค๊ตญ์–ด ์ถ”๋ก  ์–ธ์–ด ๋ชจ๋ธ(RLM)์—์„œ ๋ฐœ์ƒํ•˜๋Š” ์–ธ์–ด ์ž์› ํ’๋ถ€๋„์— ๋”ฐ๋ฅธ ์ถ”๋ก  ์„ฑ๋Šฅ ๊ฒฉ์ฐจ์˜ ๊ทผ๋ณธ ์›์ธ์„ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค. ์—ฐ๊ตฌ์ง„์€ ์ด ๊ฒฉ์ฐจ๊ฐ€ ์ฃผ๋กœ ๋ชจ๋ธ์ด ๋‹ค๊ตญ์–ด ์ž…๋ ฅ์„ ์ถ”๋ก ์— ์ฃผ๋กœ ์‚ฌ์šฉ๋˜๋Š” ์–ธ์–ด(๋Œ€๊ฐœ ์˜์–ด)๋กœ ์ œ๋Œ€๋กœ ์ดํ•ดํ•˜๊ณ  ๋ฒˆ์—ญํ•˜์ง€ ๋ชปํ•˜๋Š” ์–ธ์–ด ์ดํ•ด ์‹คํŒจ์—์„œ ๋น„๋กฏ๋จ์„ ๋ฐํ˜€๋ƒˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ, ์–ธ์–ด ์ดํ•ด ์‹คํŒจ๊ฐ€ ํƒ์ง€๋˜์—ˆ์„ ๋•Œ๋งŒ ์˜์–ด ๋ฒˆ์—ญ์„ ์ถ”๋ก  ๊ณผ์ •์— ์„ ํƒ์ ์œผ๋กœ ํ†ตํ•ฉํ•˜๋Š” 'Selective Translation' ์ „๋žต์„ ์ œ์•ˆํ•˜๊ณ , ์ด๋ฅผ ํ†ตํ•ด ๋‹ค๊ตญ์–ด ์ถ”๋ก  ๊ฒฉ์ฐจ๋ฅผ ํฌ๊ฒŒ ์™„ํ™”์‹œ์ผฐ์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
๋‹ค๊ตญ์–ด ์ถ”๋ก  ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ ๊ฒฉ์ฐจ๋Š” ์–ธ์–ด ์ž์› ๋ถ€์กฑ๋ณด๋‹ค๋Š” ๋ชจ๋ธ์˜ ์–ธ์–ด ์ดํ•ด ๋ฐ ๋ฒˆ์—ญ ๋Šฅ๋ ฅ ๋ถ€์กฑ์— ๊ธฐ์ธํ•ฉ๋‹ˆ๋‹ค.
โ€ข
์–ธ์–ด ์ดํ•ด ์‹คํŒจ๋ฅผ ํƒ์ง€ํ•˜๋Š” ๊ฒƒ์€ ๋‹ค๊ตญ์–ด ์ถ”๋ก  ๊ฒฉ์ฐจ๋ฅผ ์™„ํ™”ํ•˜๊ธฐ ์œ„ํ•œ ํšจ๊ณผ์ ์ธ ์ ‘๊ทผ ๋ฐฉ์‹์ด๋ฉฐ, ์ง€๋„ ํ•™์Šต ๊ธฐ๋ฐ˜ ํƒ์ง€ ๋ฐฉ๋ฒ•์ด ๊ฐ€์žฅ ์šฐ์ˆ˜ํ•ฉ๋‹ˆ๋‹ค.
โ€ข
์ œ์•ˆ๋œ Selective Translation ์ „๋žต์€ ์„ฑ๋Šฅ ์ €ํ•˜ ์—†์ด ์ƒ๋‹นํ•œ ์ˆ˜์ค€์œผ๋กœ ๋‹ค๊ตญ์–ด ์ถ”๋ก  ๊ฒฉ์ฐจ๋ฅผ ์ค„์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
โ€ข
ํƒ์ง€ ๋ฐฉ๋ฒ•์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ ๋ฐ ๋‹ค์–‘ํ•œ ๋ชจ๋ธ ๊ตฌ์กฐ์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ๊ฐ€๋Šฅ์„ฑ ๊ฒ€์ฆ์ด ํ–ฅํ›„ ๊ณผ์ œ๋กœ ๋‚จ์•„์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘