Sign In

Learning World Models for Interactive Video Generation

Created by
  • Haebom
Category
Empty

์ €์ž

Taiye Chen, Xun Hu, Zihan Ding, Chi Jin

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ์—ฐ๊ตฌ๋Š” ์ธํ„ฐ๋ž™ํ‹ฐ๋ธŒํ•œ ๋ฏธ๋ž˜ ๊ณ„ํš์„ ์œ„ํ•œ ๋น„๋””์˜ค ์ƒ์„ฑ์˜ ํ•ต์‹ฌ ๊ณผ์ œ์ธ ๋ณตํ•ฉ ์˜ค๋ฅ˜์™€ ๋ถ€์กฑํ•œ ๋ฉ”๋ชจ๋ฆฌ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ณ ์ž ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ์•ก์…˜ ์กฐ๊ฑด ๋ถ€์—ฌ์™€ ์ž๊ธฐํšŒ๊ท€ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ๊ฒฐํ•ฉํ•œ ๋ชจ๋ธ์„ ์ œ์•ˆํ•˜๋ฉฐ, ํŠนํžˆ ๋น„๋””์˜ค ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(VRAG) ๊ธฐ๋ฒ•๊ณผ ๋ช…์‹œ์ ์ธ ์ „์—ญ ์ƒํƒœ ์กฐ๊ฑด ๋ถ€์—ฌ๋ฅผ ํ†ตํ•ด ์žฅ๊ธฐ์ ์ธ ๋ณตํ•ฉ ์˜ค๋ฅ˜๋ฅผ ์ค„์ด๊ณ  ์‹œ๊ณต๊ฐ„์  ์ผ๊ด€์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
์ธํ„ฐ๋ž™ํ‹ฐ๋ธŒ ๋น„๋””์˜ค ์ƒ์„ฑ์—์„œ ๋ณตํ•ฉ ์˜ค๋ฅ˜์˜ ๊ทผ๋ณธ์ ์ธ ํ•œ๊ณ„๋ฅผ ์ธ์‹ํ•˜๊ณ , ์ด๋ฅผ ์™„ํ™”ํ•˜๊ธฐ ์œ„ํ•œ VRAG์™€ ์ „์—ญ ์ƒํƒœ ์กฐ๊ฑด ๋ถ€์—ฌ์˜ ์ค‘์š”์„ฑ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
โ€ข
๋‹จ์ˆœํ•œ ์ปจํ…์ŠคํŠธ ํ™•์žฅ์ด๋‚˜ ์ผ๋ฐ˜์ ์ธ ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ๊ธฐ๋ฒ•์œผ๋กœ๋Š” ๋น„๋””์˜ค ์ƒ์„ฑ์—์„œ ํšจ๊ณผ์ ์ธ ์›”๋“œ ๋ชจ๋ธ๋ง์„ ๋‹ฌ์„ฑํ•˜๊ธฐ ์–ด๋ ต๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
โ€ข
๋ณธ ์—ฐ๊ตฌ๋Š” ๋น„๋””์˜ค ์ƒ์„ฑ ๋ชจ๋ธ์˜ ๋‚ด๋ถ€ ์›”๋“œ ๋ชจ๋ธ๋ง ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•œ ํฌ๊ด„์ ์ธ ๋ฒค์น˜๋งˆํฌ๋ฅผ ๊ตฌ์ถ•ํ•˜๊ณ , ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.
๐Ÿ‘