haebom
Sign In
Decoupling Endpoint and Semantic Transition Learning for Zero-Shot Composed Image Retrieval
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Mingyu Liu, Sihan Huang, Yijia Fan, Yinlin Yan, Quan Zhang, Jian-Fang Hu, Jianhuang Lai
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ํ ์คํธ ์์ ์ ๋ฐ๋ผ ์ฐธ์กฐ ์ด๋ฏธ์ง์ ์ผ์นํ๋ ์ด๋ฏธ์ง๋ฅผ ๊ฒ์ํ๋ ์ ๋ก์ท ๋ณตํฉ ์ด๋ฏธ์ง ๊ฒ์(ZS-CIR) ๋ฌธ์ ๋ฅผ ๋ค๋ฃน๋๋ค. ๊ธฐ์กด ํฌ์ ๊ธฐ๋ฐ ๋ฐฉ์์ LLM์ ์์กดํ์ง ์์ ๊ฐ๋ณ์ง๋ง ๋ณต์กํ ์๋ฏธ ์์ ์ ์ทจ์ฝํ ๋ฌธ์ ๋ฅผ ๋ณด์์ต๋๋ค. ์ด๋ ํธ์ง ํ ์คํธ๊ฐ ์์ค ์กฐ๊ฑด๋ถ ์๋ฏธ ์ ํ์ผ๋ก ๊ธฐ๋ฅํ๊ธฐ๋ณด๋ค ๋์ ์ธก ์์ฑ ํ๋ก ์์ฉํ๋ ์๋ํฌ์ธํธ ์์ค์ ๋งค์นญ์์ ๋ฐ์ํ๋ ์๋ฏธ ์ ํ ๋ณ๋ชฉ ํ์ ๋๋ฌธ์ด๋ฉฐ, ์ ์ํ๋ DeCIR ๋ฐฉ๋ฒ์ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์๋ํฌ์ธํธ ํ์ต๊ณผ ์๋ฏธ ์ ํ ํ์ต์ ๋ถ๋ฆฌํ์ฌ ์ฑ๋ฅ์ ํฅ์์ํต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
๊ธฐ์กด ํฌ์ ๊ธฐ๋ฐ ZS-CIR ๋ฐฉ๋ฒ๋ก ์ ์ฑ๋ฅ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ณ LLM ๊ธฐ๋ฐ ์ ๊ทผ ๋ฐฉ์๊ณผ์ ๊ฒฉ์ฐจ๋ฅผ ์ค์ผ ์ ์์ต๋๋ค.
โข
์๋ํฌ์ธํธ์ ์๋ฏธ ์ ํ ํ์ต์ ๋ช ์์ ์ผ๋ก ๋ถ๋ฆฌํ๊ณ ์ด๋ฅผ ํจ๊ณผ์ ์ผ๋ก ๊ฒฐํฉํ๋ DeCIR ๋ฐฉ๋ฒ๋ก ์ ZS-CIR ๋ถ์ผ์ ๋ฐ์ ์ ๊ธฐ์ฌํฉ๋๋ค.
โข
๋ ผ๋ฌธ์์ ์ ์๋ ๋ถ๋ฆฌ ๋ฐ ๋ณํฉ ๊ธฐ๋ฒ์ด ๋ค๋ฅธ ZS-CIR ์ค์ ์ด๋ ๊ด๋ จ ์ด๋ฏธ์ง ๊ฒ์ ์์ ์ ์ด๋ป๊ฒ ์ ์ฉ๋ ์ ์๋์ง ์ถ๊ฐ์ ์ธ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage