haebom
Sign In
StreamGaze: Gaze-Guided Temporal Reasoning and Proactive Understanding in Streaming Videos
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Daeun Lee, Subhojyoti Mukherjee, Branislav Kveton, Ryan A. Rossi, Viet Dac Lai, Seunghyun Yoon, Trung Bui, Franck Dernoncourt, Mohit Bansal
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ์ฆ๊ฐ ํ์ค(AR) ์๊ฒฝ๊ณผ ๊ฐ์ ํ์ค์ ์ธ ์ ํ๋ฆฌ์ผ์ด์ ์ ์ํด ์คํธ๋ฆฌ๋ฐ ๋น๋์ค์์ ์ฌ์ฉ์ ์๋๋ฅผ ์์ธกํ๋ ๋ฅ๋ ฅ์ ํ๊ฐํ๋ ์๋ก์ด ๋ฒค์น๋งํฌ์ธ StreamGaze๋ฅผ ์๊ฐํฉ๋๋ค. StreamGaze๋ ์ธ๊ฐ์ ์์ ์ ํธ๋ฅผ ํ์ฉํ์ฌ ๊ณผ๊ฑฐ, ํ์ฌ, ๋ฏธ๋ ์ํฉ์ ๋ํ ์ถ๋ก ๋ฅ๋ ฅ์ ์ข ํฉ์ ์ผ๋ก ํ๊ฐํ๋ฉฐ, ํนํ ์ค์๊ฐ ์์ ์ ๋ณด๋ฅผ ํตํด ๋ณํํ๋ ์ฃผ์๋ฅผ ์ถ์ ํ๊ณ ์ฌ์ฉ์์ ์๋๋ฅผ ์ถ๋ก ํ๋ ๋ชจ๋ธ์ ๋ฅ๋ ฅ์ ์ธก์ ํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
์๋ก์ด ๋ฒค์น๋งํฌ์ ํ์์ฑ:
๊ธฐ์กด์ ์คํธ๋ฆฌ๋ฐ ๋น๋์ค ์ดํด ๋ฒค์น๋งํฌ๋ ์์ ์ ๋ณด๋ฅผ ํ์ฉํ ๋ค์ค ๋ชจ๋ฌ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(MLLM)์ ๋ฅ๋ ฅ์ ์ธก์ ํ์ง ๋ชปํ๊ธฐ์ StreamGaze๋ ์ด ๊ฐ๊ทน์ ๋ฉ์๋๋ค.
โข
์ธ๊ฐ ์์ ๊ธฐ๋ฐ ์ถ๋ก ๋ฅ๋ ฅ์ ํ๊ณ:
์ต์ฒจ๋จ MLLM์ ์ธ๊ฐ์ ์์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ์๊ฐ์ ์ถ๋ก , ์๋ ๋ชจ๋ธ๋ง, ์ ์ ์ ์์ธก์์ ์๋นํ ์ฑ๋ฅ ๊ฒฉ์ฐจ๋ฅผ ๋ณด์ด๋ฉฐ, ํ์ฌ ๋ชจ๋ธ์ ํ๊ณ๋ฅผ ๋ช ํํ ๋ณด์ฌ์ค๋๋ค.
โข
ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ ์ ์:
์์ธํ ๋ถ์์ ํตํด ์์ ํ๋กฌํํธ ์ ๋ต, ์ถ๋ก ํ๋, ์คํจ ๋ชจ๋์ ๋ํ ํต์ฐฐ์ ์ ๊ณตํ์ฌ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ์ ์ ์ํ๊ณ , ๊ณต๊ฐ๋ ๋ฐ์ดํฐ์ ์ฝ๋๋ ํด๋น ๋ถ์ผ์ ๋ฐ์ ์ ๊ธฐ์ฌํ ๊ฒ์ ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage