haebom
Sign In
COGNITION: From Evaluation to Defense against Multimodal LLM CAPTCHA Solvers
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Junyu Wang, Changjia Zhu, Yuanbo Zhou, Lingyao Li, Xu He, Mingkui Wei, Junjie Xiong
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ๋ฉํฐ๋ชจ๋ฌ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(MLLM)์ด ๊ธฐ์กด ์๊ฐ์ ์บก์ฑ ์ ๋ณด์์ ์ด๋ป๊ฒ ์ฝํ์ํค๋์ง ๋ถ์ํฉ๋๋ค. ์์ฉ ๋ฐ ์คํ์์ค MLLM 7์ข ์ ๋์์ผ๋ก 18๊ฐ์ง ์ค์ ์บก์ฑ ๊ณผ์ ์ ํ์ ๋ํ ํด๊ฒฐ ๋ฅ๋ ฅ์ ํ๊ฐํ์ผ๋ฉฐ, MLLM์ด ํน์ ์ ํ์ ์บก์ฑ ๋ฅผ ์ธ๊ฐ ์์ค์ ๋น์ฉ๊ณผ ์ง์ฐ ์๊ฐ์ผ๋ก ํด๊ฒฐํ ์ ์์์ ๋ฐํ์ต๋๋ค. ์ด๋ฅผ ๋ฐํ์ผ๋ก ์บก์ฑ ๊ฐํ ๋ฐฉ์์ ์ ์ํ๊ณ , ์ค์ ๋ก ์ทจ์ฝํ ์บก์ฑ ์ ํ์ ์ฑ๊ณต์ ์ผ๋ก ๋ฐฉ์ดํ๋ ์ฌ๋ก๋ฅผ ๋ณด์ฌ์ค๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
MLLM์ ์ธ์ ๊ธฐ๋ฐ ๋ฐ ์ํธ์์ฉ์ด ์ ์ ์บก์ฑ ๊ณผ์ ์ ๋ํด ์ธ๊ฐ๊ณผ ์ ์ฌํ ์์ค์ ๋น์ฉ๊ณผ ์ง์ฐ ์๊ฐ์ผ๋ก ๋์ ํด๊ฒฐ ์ฑ๊ณต๋ฅ ์ ๋ณด์ ๋๋ค.
โข
์บก์ฑ ์ค๊ณ ์ ์ ๊ตํ ์์น ์ธ์, ๋ค๋จ๊ณ ๊ณต๊ฐ ์ถ๋ก , ํ๋ ์ ๊ฐ ์ผ๊ด์ฑ ์๊ตฌ ์ฌํญ์ ๊ฐํํ๋ ๊ฒ์ด MLLM ๊ธฐ๋ฐ ๊ณต๊ฒฉ์ ๋ํ ํจ๊ณผ์ ์ธ ๋ฐฉ์ด ์ ๋ต์ด ๋ ์ ์์ต๋๋ค.
โข
ํ์ฌ MLLM์ ๋ฏธ์ธํ ์์น ํ์ , ๋ณต์กํ ๊ณต๊ฐ ์ถ๋ก , ๋๋ ์ฌ๋ฌ ํ๋ ์์ ๊ฑธ์น ์ผ๊ด์ฑ์ ์๊ตฌํ๋ ์บก์ฑ ์๋ ์ฌ์ ํ ์ด๋ ค์์ ๊ฒช์ต๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage