Sign In

Post-Training Language Models for Crosslingual Consistency

์ž‘์„ฑ์ž
  • Haebom
์นดํ…Œ๊ณ ๋ฆฌ
Empty

์ €์ž

Tianyu Liu, Jirui Qi, Mrinmaya Sachan, Ryan Cotterell, Raquel Fernandez, Arianna Bisazza

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ๋‹ค๊ตญ์–ด ์–ธ์–ด ๋ชจ๋ธ์ด ๋ฒˆ์—ญ ๋“ฑ๊ฐ€์ ์ธ ํ”„๋กฌํ”„ํŠธ์— ๋Œ€ํ•ด ์–ธ์–ด๋ณ„๋กœ ์ผ๊ด€๋˜์ง€ ์•Š์€ ์‘๋‹ต์„ ์ƒ์„ฑํ•˜๋Š” ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์ •๋ณด ์ด๋ก ์  ๊ด€์ ์—์„œ ๊ต์ฐจ ์–ธ์–ด ์ผ๊ด€์„ฑ์„ ์ •์˜ํ•˜๊ณ , ์ด๋ฅผ ๊ฐœ์„ ํ•˜๋Š” ์‚ฌํ›„ ํ›ˆ๋ จ ์ ˆ์ฐจ์ธ 'ํŽ˜๋„ํ‹ฐ ์ผ๊ด€์„ฑ ์ตœ์ ํ™”(PCO)'๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. PCO๋ฅผ ํšจ์œจ์ ์œผ๋กœ ๊ตฌํ˜„ํ•˜๊ธฐ ์œ„ํ•œ '์ง์ ‘ ์ผ๊ด€์„ฑ ์ตœ์ ํ™”(DCO)' ๊ธฐ๋ฒ•์„ ๊ฐœ๋ฐœํ•˜์—ฌ, ๊ด‘๋ฒ”์œ„ํ•œ ์–ธ์–ด ๋ชจ๋ธ๊ณผ 26๊ฐœ ์–ธ์–ด์— ๊ฑธ์ณ ๊ต์ฐจ ์–ธ์–ด ์ผ๊ด€์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ค๊ณ  ์ €์ž์› ์–ธ์–ด์˜ ๋งž์ถคํ˜• ์ •๋ ฌ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•จ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
๋‹ค๊ตญ์–ด ์–ธ์–ด ๋ชจ๋ธ์˜ ์ผ๊ด€์„ฑ ๋ถ€์กฑ ๋ฌธ์ œ๋ฅผ ์ •๋ณด ์ด๋ก ์ ์œผ๋กœ ์ •๋Ÿ‰ํ™”ํ•˜๊ณ  ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ์ƒˆ๋กœ์šด ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
โ€ข
์ œ์•ˆ๋œ DCO ๊ธฐ๋ฒ•์€ ๊ธฐ์กด ๋ฐฉ๋ฒ•๋ก ๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ, ํŠนํžˆ ์ €์ž์› ์–ธ์–ด์˜ ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•˜๋Š” ๋ฐ ํšจ๊ณผ์ ์ž…๋‹ˆ๋‹ค.
โ€ข
์‚ฌํ›„ ํ›ˆ๋ จ ์ ˆ์ฐจ๋กœ์„œ, ๊ธฐ์กด ๋ชจ๋ธ์„ ์ถ”๊ฐ€์ ์ธ ํ›ˆ๋ จ ์—†์ด ์ผ๊ด€์„ฑ ์žˆ๊ฒŒ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋Š” ์‹ค์šฉ์ ์ธ ๋ฐฉ๋ฒ•์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
โ€ข
DCO๊ฐ€ ์ตœ์ ํ™”ํ•˜๋Š” ์ด์งˆ์  ์ผ๊ด€์„ฑ ์ธก์ • ๊ธฐ์ค€์ด ์‹ค์ œ ์‚ฌ์šฉ์ž ๊ฒฝํ—˜๊ณผ ์–ด๋–ป๊ฒŒ ์—ฐ๊ด€๋˜๋Š”์ง€์— ๋Œ€ํ•œ ์ถ”๊ฐ€์ ์ธ ํƒ๊ตฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
๐Ÿ‘