haebom
Sign In
Universal Adversarial Attacks against Closed-Source MLLMs via Target-View Routed Meta Optimization
Created by
Haebom
Category
Empty
์ ์
Hui Lu, Yi Yu, Yiming Yang, Chenyu Yi, Xueyi Ke, Qixing Zhang, Bingquan Shen, Alex Kot, Xudong Jiang
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ์์ฉ์ผ๋ก ๊ณต๊ฐ๋์ง ์์ ๋ฉํฐ๋ชจ๋ฌ ๋ํ ์ธ์ด ๋ชจ๋ธ(MLLM)์ ๋์์ผ๋ก, ๋จ ํ๋์ ์ ๋์ ๊ณต๊ฒฉ์ด ๋ค์ํ ์ ๋ ฅ์ ๋ํด ํน์ ๋ชฉํ๋ฅผ ๋ฌ์ฑํ๋๋ก ํ๋ ๋ฒ์ฉ ๋ชฉํ ๊ธฐ๋ฐ ๊ณต๊ฒฉ(UTTAA) ๋ฐฉ๋ฒ์ ์ ์ํฉ๋๋ค. ๊ธฐ์กด ๊ณต๊ฒฉ ๋ฐฉ์์ ์ ๋ ฅ๋ง๋ค ๊ฐ๋ณ์ ์ผ๋ก ์์ฑ๋์ด ์ฌ์ฌ์ฉ์ฑ์ด ๋ฎ๋ค๋ ํ๊ณ๊ฐ ์์์ผ๋, ์ ์๋ MCRMO-Attack์ ๋ค์ค ํฌ๋กญ ์์๊ณผ ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ํ์ฉํ์ฌ ํ์ต์ ๋ถ์์ ์ฑ์ ์ค์ด๊ณ , ํ ํฐ ๋ผ์ฐํ ๊ธฐ๋ฒ์ผ๋ก ์์ ํน์ง๊ณผ ํ ์คํธ ๊ฐ์ ์ฐ๊ด์ฑ์ ๊ฐํํ์ต๋๋ค. ์ด๋ฅผ ํตํด GPT-4o์ Gemini-2.0๊ณผ ๊ฐ์ ์์ฉ MLLM์ ๋ํด ์ด์ ๋ณด๋ค ํจ์ฌ ๋์ ๊ณต๊ฒฉ ์ฑ๊ณต๋ฅ ์ ๋ฌ์ฑํ์ต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
** ๋ฒ์ฉ ๊ณต๊ฒฉ์ ๊ฐ๋ฅ์ฑ ์ ์**: ์ ๋ ฅ์ ๋ ๋ฆฝ์ ์ผ๋ก ์ ์ฉ ๊ฐ๋ฅํ ๋จ์ผ ์ ๋์ ๊ณต๊ฒฉ ๋ฐฉ๋ฒ๋ก ์ ํตํด MLLM ๋ณด์์ ์๋ก์ด ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ค๋๋ค.
โข
** ์์ฉ MLLM ๋ณด์ ์ทจ์ฝ์ ์์ฌ**: ๊ณต๊ฐ๋์ง ์์ ์์ฉ MLLM ๋ํ ๋ฒ์ฉ์ ์ธ ๊ณต๊ฒฉ์ ์ทจ์ฝํ ์ ์์์ ์์ฌํ๋ฉฐ, ์ด์ ๋ํ ๋ฐฉ์ด ์ ๋ต ๋ง๋ จ์ ํ์์ฑ์ ๊ฐ์กฐํฉ๋๋ค.
โข
** ๊ณต๊ฒฉ ์ฑ๊ณต๋ฅ ์ฆ๋**: ์ ์๋ MCRMO-Attack์ ๊ธฐ์กด ๋ฒ์ฉ ๊ณต๊ฒฉ ๋ฐฉ์ ๋๋น ์๋นํ ๊ณต๊ฒฉ ์ฑ๊ณต๋ฅ ํฅ์์ ๋ณด์ฌ์ฃผ์ด, MLLM ๋ณด์ ์ฐ๊ตฌ์ ์ค์ํ ์ง์ ์ ์ด๋ฃจ์์ต๋๋ค.
โข
** ํ๊ณ์ **: ์ ์๋ ๋ฐฉ๋ฒ๋ก ์ด ํน์ ์ ํ์ MLLM์๋ง ํจ๊ณผ์ ์ด๊ฑฐ๋, ๊ณต๊ฒฉ์ด ์์ฑ๋๋ ๋ฐ ์๋นํ ๊ณ์ฐ ์์์ด ์์๋ ์ ์์ต๋๋ค. ๋ํ, ์ค์ ํ๊ฒฝ์์์ ๊ณต๊ฒฉ ํจ๊ณผ ๋ฐ ๋ฐฉ์ด ๋ฐฉ๋ฒ์ ๋ํ ์ถ๊ฐ์ ์ธ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage