๋ณธ ์ฐ๊ตฌ๋ ๊ธฐ์กด ์๊ฐ-์ธ์ด ๋ชจ๋ธ(VLM)์ ์ธ์ด์ ๋ณํ์ ๋ํ ๋ฏผ๊ฐ๋๋ฅผ ์ธก์ ํ๋ ์๋ก์ด ๋ฒค์น๋งํฌ์ธ Language-Guided Invariance Probing (LGIP)์ ์ ์ํฉ๋๋ค. LGIP๋ ์๋ฏธ๋ฅผ ์ ์งํ๋ ํจ๋ฌํ๋ ์ด์ฆ์ ๋ํ ๋ถ๋ณ์ฑ๊ณผ ์๋ฏธ๋ฅผ ๋ฐ๊พธ๋ ํธ์ง์ ๋ํ ๋ฏผ๊ฐ๋๋ฅผ ํ๊ฐํ๋ฉฐ, ์ด๋ฅผ ํตํด ๊ธฐ์กด์ ์ ๋ก์ท ์ฑ๋ฅ ์งํ๋ก๋ ํ์
ํ๊ธฐ ์ด๋ ค์ด VLM์ ์ธ์ด์ ๊ฒฌ๊ณ ์ฑ์ ์ง๋จํฉ๋๋ค. ์ฐ๊ตฌ ๊ฒฐ๊ณผ, ์ผ๋ถ ์ต์ VLM๋ค์ ์ข์ ์ฑ๋ฅ์ ๋ณด์์ง๋ง, ๋ค๋ฅธ ๋ชจ๋ธ๋ค์ ์๋ฏธ ๋ณํ์ ์ทจ์ฝํ ๋ชจ์ต์ ๋ณด์์ผ๋ฉฐ ์ด๋ ์ผ๋ฐ์ ์ธ ํ๊ฐ ์งํ๋ก๋ ๊ฐ์งํ๊ธฐ ์ด๋ ค์ ์ต๋๋ค.