haebom
Sign In
MC-Search: Evaluating and Enhancing Multimodal Agentic Search with Structured Long Reasoning Chains
Created by
Haebom
Category
Empty
์ ์
Xuying Ning, Dongqi Fu, Tianxin Wei, Mengting Ai, Jiaru Zou, Ting-Wei Li, Hanghang Tong, Yada Zhu, Hendrik Hamann, Jingrui He
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ๊ธฐ์กด์ ๋จ์ํ ์ง์์๋ต ํ์์ ๋์ด์ ๋ณต์กํ ๋ค๋จ๊ณ, ๊ต์ฐจ ๋ชจ๋ฌ, ์ง์ ๊ธฐ๋ฐ ์ถ๋ก ์ ์ํ ์ฐจ์ธ๋ ๋ฉํฐ๋ชจ๋ฌ ์์ด์ ํธ ๊ฒ์(MM-RAG)์ ํ๊ฐํ๊ณ ๊ฐ์ ํ๊ธฐ ์ํ MC-Search๋ผ๋ ์ต์ด์ ๋ฒค์น๋งํฌ๋ฅผ ์ ์ํฉ๋๋ค. MC-Search๋ 5๊ฐ์ง ๋ํ์ ์ธ ์ถ๋ก ๊ตฌ์กฐ๋ฅผ ์์ฐ๋ฅด๋ 3,333๊ฐ์ ๊ณ ํ์ง ์์๋ฅผ ํฌํจํ๋ฉฐ, ์ด๋ฅผ ํตํด ๊ธฐ์กด ๋ฒค์น๋งํฌ์์ ๊ฐ๊ณผ๋์๋ ์ ์์ ๊ณํ ๋ฐ ๋ฉํฐ๋ชจ๋ฌ ์ถ๋ก ๋ฅ๋ ฅ์ ์ธก์ ํฉ๋๋ค. ๋ํ, ์ด๋ฌํ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ Search-Align ํ๋ ์์ํฌ๋ฅผ ํตํด ์คํ์์ค MLLM์ ๊ณํ ๋ฐ ๊ฒ์ ์ถฉ์ค๋๋ฅผ ํฅ์์ํค๋ ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
๊ธฐ์กด ๋ฉํฐ๋ชจ๋ฌ ์ง์์๋ต ๋ฒค์น๋งํฌ์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ณ , ๋ณต์กํ ์ถ๋ก ๊ณผ์ ์ ํ๊ฐํ ์ ์๋ ์๋ก์ด ํ์ค์ ์ ์ํฉ๋๋ค.
โข
์์ด์ ํธ ๊ธฐ๋ฐ ๋ฉํฐ๋ชจ๋ฌ ๊ฒ์ ์์คํ ์ ์ค์ ์ถ๋ก ๊ณผ์ ์ ์ ํ์ฑ๊ณผ ํจ์จ์ฑ์ ์ธก์ ํ ์ ์๋ ๊ตฌ์ฒด์ ์ธ ์งํ๋ค์ ๋์ ํ์ต๋๋ค.
โข
์ ์๋ ๋ฒค์น๋งํฌ์ ํ์ต ํ๋ ์์ํฌ๋ ์คํ์์ค MLLM์ ๋ค๋จ๊ณ ์ถ๋ก ๋ฐ ๊ต์ฐจ ๋ชจ๋ฌ ๊ฒ์ ๋ฅ๋ ฅ์ ์ค์ง์ ์ผ๋ก ํฅ์์ํฌ ์ ์๋ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋๋ค.
โข
MC-Search ๋ฒค์น๋งํฌ์ ๊ท๋ชจ๋ฅผ ๋์ฑ ํ์ฅํ๊ณ , ๋ค์ํ ์ข ๋ฅ์ ๋ณต์กํ ์ถ๋ก ํจํด์ ์ถ๊ฐ์ ์ผ๋ก ํฌํจ์ํค๋ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage