Sign In

Flow Map Language Models: One-step Language Modeling via Continuous Denoising

์ž‘์„ฑ์ž
  • Haebom
์นดํ…Œ๊ณ ๋ฆฌ
Empty

์ €์ž

Chanhyuk Lee, Jaehoon Yoo, Manan Agarwal, Sheel Shah, Jerry Huang, Aditi Raghunathan, Seunghoon Hong, Nicholas M. Boffi, Jinwoo Kim

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ์ด์‚ฐ ํ™•์‚ฐ ๋ชจ๋ธ์˜ ๋น ๋ฅธ ์ƒ์„ฑ ์†๋„ ์ž ์žฌ๋ ฅ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๋ฐœ์ƒํ•˜๋Š” ๋‚ฎ์€ ์ƒ˜ํ”Œ ํ’ˆ์งˆ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ์—ฐ์†์ ์ธ ํ๋ฆ„(flow)์„ ์ด์šฉํ•œ ์ƒˆ๋กœ์šด ์–ธ์–ด ๋ชจ๋ธ๋ง ๋ฐฉ๋ฒ•๋ก ์ธ Flow Map Language Models (FMLM)์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์€ ์ด์‚ฐ ํ† ํฐ ์ž„๋ฒ ๋”ฉ ์œ„์—์„œ ์ •์˜๋œ ์—ฐ์†์ ์ธ ํ๋ฆ„ ๋งต์„ ์ง์ ‘ ํ•™์Šตํ•จ์œผ๋กœ์จ, ๋ช‡ ๋‹จ๊ณ„์˜ ์ถ”๋ก ๋งŒ์œผ๋กœ๋„ ๋†’์€ ํ’ˆ์งˆ์˜ ์ƒ˜ํ”Œ์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๊ธฐ์กด์˜ ์ด์‚ฐ ํ™•์‚ฐ ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ์†๋„์™€ ํ’ˆ์งˆ์„ ๋‹ฌ์„ฑํ•˜๋ฉฐ, ์ด์‚ฐ์  ๋ฐ์ดํ„ฐ๋ฅผ ์œ„ํ•œ ์ด์‚ฐ ๋…ธ์ด์ง• ๊ณผ์ •์˜ ํ•„์š”์„ฑ์— ๋Œ€ํ•œ ๊ธฐ์กด ๊ฐ€์„ค์— ๋„์ „ํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
์—ฐ์† ํ๋ฆ„์„ ํ†ตํ•œ ํšจ์œจ์ ์ธ ์–ธ์–ด ๋ชจ๋ธ๋ง: ์ด์‚ฐ ํ™•์‚ฐ ๋ชจ๋ธ์˜ ๋‹จ์ ์„ ๊ทน๋ณตํ•˜๊ณ , ๋ช‡ ๋‹จ๊ณ„์˜ ์ถ”๋ก ๋งŒ์œผ๋กœ๋„ ๊ณ ํ’ˆ์งˆ ์ƒ˜ํ”Œ ์ƒ์„ฑ์ด ๊ฐ€๋Šฅํ•œ ์ƒˆ๋กœ์šด ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
โ€ข
๋‹จ์ผ ๋‹จ๊ณ„ ์ƒ์„ฑ ๋ชจ๋ธ์˜ ๊ฐ€๋Šฅ์„ฑ: ์–ธ์–ด ๋ชจ๋ธ๋ง์—์„œ ๊ธฐ์กด์˜ ๋‹ค๋‹จ๊ณ„ ์ƒ์„ฑ ๊ณผ์ •์„ ๋ฒ—์–ด๋‚˜, ๋‹จ ํ•œ ๋‹จ๊ณ„์˜ ์ถ”๋ก ์œผ๋กœ๋„ ๋งŒ์กฑ์Šค๋Ÿฌ์šด ๊ฒฐ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
โ€ข
์ด์‚ฐ ๋ฐ์ดํ„ฐ ์ƒ์„ฑ ๋ชจ๋ธ๋ง์— ๋Œ€ํ•œ ์žฌํ•ด์„: ์ด์‚ฐ์ ์ธ ํ† ํฐ์„ ๋‹ค๋ฃจ๋Š” ์ƒ์„ฑ ๋ชจ๋ธ์—์„œ ์ด์‚ฐ์ ์ธ ๋…ธ์ด์ง• ๊ณผ์ •์ด ํ•„์ˆ˜์ ์ด์ง€ ์•Š๋‹ค๋Š” ๊ฒƒ์„ ์ž…์ฆํ•˜๋ฉฐ, ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ์— ์ค‘์š”ํ•œ ์‹œ์‚ฌ์ ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
โ€ข
๋ชจ๋ธ ๋ณต์žก์„ฑ ๋ฐ ํ•™์Šต ์•ˆ์ •์„ฑ: ์ œ์•ˆ๋œ ์—ฐ์† ํ๋ฆ„ ๋ชจ๋ธ์˜ ํ•™์Šต ์•ˆ์ •์„ฑ ๋ฐ ํŠน์ • ๋ฐ์ดํ„ฐ์…‹์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์— ๋Œ€ํ•œ ์ถ”๊ฐ€์ ์ธ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘