haebom
Sign In
Task-conditioned probing of instruction-tuned multimodal LLMs: Region-specific brain alignment patterns under naturalistic stimuli
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Subba Reddy Oota, Khushbu Pahwa, Prachi Jindal, Satya Sai Srinath Namburi, Maneesh Singh, Tanmoy Chakraborty, Bapi S. Raju, Manish Gupta
๐ก ๊ฐ์
๋ณธ ์ฐ๊ตฌ๋ ์ง์์ด์ ๋ฐ๋ผ ๋ฏธ์ธ ์กฐ์ ๋ ๋ฉํฐ๋ชจ๋ฌ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(IT-MLLM)์ด ์์ฐ์ค๋ฌ์ด ์ํ ์์ฒญ ์ค ๋ ํ๋๊ณผ ์ผ๋ง๋ ์ ์ผ์นํ๋์ง ํ์ํฉ๋๋ค. ๋ค์ํ ๋น๋์ค ๋ฐ ์ค๋์ค IT-MLLM์ ์ฌ์ฉํ์ฌ 13๊ฐ์ง ๋น๋์ค ์์ ์ง์์ด์ ๋ฐ๋ฅธ ๋ ์ ๋ ฌ ํจํด์ ๋ถ์ํ ๊ฒฐ๊ณผ, IT-MLLM์ด ๊ธฐ์กด ๋ชจ๋ธ๋ณด๋ค ๋ ํ๋์ ๋ ์ ์์ธกํ๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ์ต๋๋ค. ํนํ, IT-MLLM์ ์์ ๋ณ๋ก ๊ตฌ๋ถ๋๋ ํํ์ ์์ฑํ๋ฉฐ ๋์ ํน์ ์์ญ๊ณผ ๋์ ์ ๋ ฌ์ ๋ณด์์ต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
์ง์์ด ๋ฏธ์ธ ์กฐ์ (Instruction-tuning)์ด ๋ฉํฐ๋ชจ๋ฌ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(MLLM)์ ๋ ์ ๋ ฌ์ ๊ฐํ์ํค๋ฉฐ, ์ด๋ ๋จ์ํ ํ๋ฉด์ ์๋ฏธ๋ฅผ ๋์ด ๊ธฐ๋ฅ์ ์์ ์๊ตฌ์ ๋ฐ๋ผ ํํ์ ๊ตฌ์ฑํจ์ ์์ฌํฉ๋๋ค.
โข
IT-MLLM์ ๋์ ๋ค์ํ ์์ญ์์ ์์ ๋ณ๋ก ๊ณ ์ ํ ํํ์ ํ์ฑํ๋ฉฐ, ์ด๋ ์ธ๊ฐ์ ๋์ MLLM ๊ฐ์ ์ ๋ณด ์ฒ๋ฆฌ ๋ฐฉ์์ ์ดํดํ๋ ๋ฐ ์ค์ํ ๋จ์๋ฅผ ์ ๊ณตํฉ๋๋ค.
โข
in-context learning (ICL) ๋ชจ๋ธ์ ํ ์คํธ ์๋ฏธ์ ๊ฐํ ์๊ด๊ด๊ณ๋ฅผ ๋ณด์ธ ๋ฐ๋ฉด, IT ๋ชจ๋ธ์ ์ง์์ด ํ ์คํธ ์๋ฏธ์์ ์๊ด๊ด๊ณ๊ฐ ๋ฎ์์ผ๋ฉฐ, ์ด๋ ์์ ์กฐ๊ฑด์ ๋ฐ๋ฅธ ํํ ๊ณต๊ฐ์ ๋ถ๋ฆฌ๊ฐ ๋ ์ ๋ ฌ ์ฆ๊ฐ์ ๊ด๋ จ ์์์ ๋ณด์ฌ์ค๋๋ค.
โข
ํฅํ ์ฐ๊ตฌ์์๋ ๋ ๋ค์ํ ์์ฐ์ค๋ฌ์ด ์๊ทน๊ณผ ์์ ์ง์์ด๋ฅผ ์ฌ์ฉํ์ฌ IT-MLLM์ ๋ ์ ๋ ฌ ๋ฉ์ปค๋์ฆ์ ์ฌ์ธต์ ์ผ๋ก ๋ถ์ํ๊ณ , ์ด๋ฌํ ๋ชจ๋ธ์ ํ์ฉํ์ฌ ๋-์ปดํจํฐ ์ธํฐํ์ด์ค ๊ฐ๋ฐ ๋ฑ์ ์ ์ฉํ ์ ์์ ๊ฒ์ ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage