Sign In

Targeted Remasking: Replacing Token Editing with Token-to-Mask Refinement in Discrete Diffusion Language Models

์ž‘์„ฑ์ž
  • Haebom
์นดํ…Œ๊ณ ๋ฆฌ
Empty

์ €์ž

Lin Yao

๐Ÿ’ก ๊ฐœ์š”

์ด ๋…ผ๋ฌธ์€ ์ด์‚ฐ ํ™•์‚ฐ ์–ธ์–ด ๋ชจ๋ธ์˜ ํ…์ŠคํŠธ ์ƒ์„ฑ ์†๋„๋ฅผ ๋†’์ด๊ธฐ ์œ„ํ•ด ์ œ์•ˆ๋œ ํ† ํฐ-ํˆฌ-ํ† ํฐ(T2T) ํŽธ์ง‘ ๋ฐฉ์‹์˜ ๊ทผ๋ณธ์ ์ธ ํ•œ๊ณ„๋ฅผ ์ง€์ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ์˜ค๋ฅ˜๋กœ ์˜์‹ฌ๋˜๋Š” ํ† ํฐ์„ ๋‹ค์‹œ ๋งˆ์Šคํฌ ์ƒํƒœ๋กœ ๋˜๋Œ๋ ค ํ™•์‚ฐ ๊ณผ์ •์ด ๋” ๊นจ๋—ํ•œ ๋งฅ๋ฝ์—์„œ ์žฌ์˜ˆ์ธกํ•˜๋„๋ก ํ•˜๋Š” ํ›ˆ๋ จ-ํ”„๋ฆฌ ๋ฐฉ์‹์ธ ํ† ํฐ-ํˆฌ-๋งˆ์Šคํฌ(T2M) ๋ฆฌ๋งˆ์Šคํ‚น์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. T2M์€ ํ™•๋ฅ  ๊ธฐ๋ฐ˜, ํŠธ๋ฆฌ๊ฑฐ ๋ฏธ๋Ÿฌ๋ง, ์‹œ๊ฐ„ ์ฐจ์ด ๊ธฐ๋ฐ˜์˜ ์„ธ ๊ฐ€์ง€ ์˜ค๋ฅ˜ ํƒ์ง€ ์ „๋žต๊ณผ ํ•จ๊ป˜ ์‚ฌ์šฉ๋˜์–ด, ์ƒ์„ฑ ๋งฅ๋ฝ์„ ์ •ํ™”ํ•˜๊ณ  ์‹œ์Šคํ…œ์  ์ถ”๋ก  ์˜ค๋ฅ˜๋ฅผ ๋ชจ๋ธ์˜ ๋„ค์ดํ‹ฐ๋ธŒ ๋งˆ์Šคํฌ ๋…ธ์ด์ฆˆ ํƒ€์ž…์œผ๋กœ ๋˜๋Œ๋ฆฝ๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
T2M ๋ฆฌ๋งˆ์Šคํ‚น์€ T2T ํŽธ์ง‘ ๋ฐฉ์‹์˜ ์˜ค๋ฅ˜ ๊ฐ์ง€ ๋ฐ ์˜ˆ์ธก ๊ฒฐํ•ฉ, ์ƒ์„ฑ ๋งฅ๋ฝ ์˜ค์—ผ, ํ›ˆ๋ จ-์ถ”๋ก  ๋…ธ์ด์ฆˆ ๋ถˆ์ผ์น˜ ๋ฌธ์ œ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ•ด๊ฒฐํ•ฉ๋‹ˆ๋‹ค.
โ€ข
์ œ์•ˆ๋œ T2M ๋ฐฉ์‹์€ ๋‹ค์–‘ํ•œ ๋ฒค์น˜๋งˆํฌ์—์„œ ํŠนํžˆ ์ˆ˜ํ•™๊ณผ ๊ฐ™์€ ์ •๋ฐ€ํ•œ ํ† ํฐ ๋ ˆ๋ฒจ ์ถœ๋ ฅ์ด ์š”๊ตฌ๋˜๋Š” ์ž‘์—…์—์„œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๊ฐ€์ ธ์˜ค๋ฉฐ, ๋งˆ์ง€๋ง‰ ๋‹จ๊ณ„์˜ ํ† ํฐ ์†์ƒ์œผ๋กœ ์ธํ•œ ์˜ค๋ฅ˜๋ฅผ ์ƒ๋‹น ๋ถ€๋ถ„ ๋ณต๊ตฌํ•ฉ๋‹ˆ๋‹ค.
โ€ข
T2M์€ ํ›ˆ๋ จ-ํ”„๋ฆฌ ๋ฐ ๋“œ๋กญ-์ธ ๋Œ€์ฒด ๊ธฐ๋Šฅ์œผ๋กœ ๊ธฐ์กด ํ™•์‚ฐ ์–ธ์–ด ๋ชจ๋ธ์— ์‰ฝ๊ฒŒ ํ†ตํ•ฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
โ€ข
์ œ์•ˆ๋œ ์˜ค๋ฅ˜ ํƒ์ง€ ์ „๋žต๋“ค์˜ ์„ฑ๋Šฅ ๋ฐ ์กฐํ•ฉ ์ตœ์ ํ™”์— ๋Œ€ํ•œ ์ถ”๊ฐ€ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘