haebom
Sign In
How does longer temporal context enhance multimodal narrative video processing in the brain?
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Prachi Jindal, Anant Khandelwal, Manish Gupta, Bapi S. Raju, Subba Reddy Oota, Tanmoy Chakraborty
๐ก ๊ฐ์
๋ณธ ์ฐ๊ตฌ๋ ๋ฉํฐ๋ชจ๋ฌ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(MLLM)์ด ๊ธด ์๊ฐ์ ๋งฅ๋ฝ์ ํ์ฉํ ๋ ๋ ํ๋๊ณผ์ ์ ๋ ฌ์ด ํฅ์๋๋์ง ์กฐ์ฌํฉ๋๋ค. ๋ ์์(fMRI)๊ณผ ๋ชจ๋ธ ํน์ง์ ๋น๊ตํ ๊ฒฐ๊ณผ, ํด๋ฆฝ ๊ธธ์ด๊ฐ ๊ธธ์ด์ง์๋ก MLLM์ ๋ ์ ๋ ฌ์ด ํฌ๊ฒ ๊ฐ์ ๋์์ผ๋, ๋จ์ผ ๋ชจ๋ฌ ๋น๋์ค ๋ชจ๋ธ์ ๊ทธ๋ ์ง ์์์ต๋๋ค. ์ด๋ ๊ธด ์๊ฐ์ ๋งฅ๋ฝ ์ฒ๋ฆฌ๊ฐ MLLM์ ๊ณ ์ฐจ์ ํตํฉ ์์ญ๊ณผ ๋์ ์ ์ฌํ ์์ญ ๊ฐ์ ์ผ๊ด์ฑ์ ๋์์ ์์ฌํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
๊ธด ์๊ฐ์ ๋งฅ๋ฝ์ MLLM์ด ์ธ๊ฐ์ ์์ฌ ์ดํด ๊ณผ์ ์ ๋ ํ๋๊ณผ ๋ ์ ์ผ์น์ํค๋๋ก ๋์ต๋๋ค.
โข
MLLM์ ๊ณ์ธต์ ๊ตฌ์กฐ๋ ๋์ ํผ์ง ์์ญ ๊ณ์ธต ๊ตฌ์กฐ์ ์ ์ฌํ๊ฒ ์งง์ ๋งฅ๋ฝ์ ์ด๊ธฐ ์ฒ๋ฆฌ ์์ญ๊ณผ, ๊ธด ๋งฅ๋ฝ์ ๊ณ ์ฐจ์ ํตํฉ ์์ญ๊ณผ ์ ๋ ฌ๋ฉ๋๋ค.
โข
์์ฌ ๊ณผ์ ํ๋กฌํํธ๋ ๋ ์ ๋ ฌ ํจํด์ ํน์ ์์ ๋ฐ ์์ญ ์์กด์ ์ธ ์ํฅ์ ๋ฏธ์น๋ฉฐ, ๊ณ ์ฐจ์ ์์ญ์ ๋งฅ๋ฝ ์์กด์ ์ธ ํ๋ ๋ณํ๋ฅผ ์ ๋ฐํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage