haebom
Sign In
DARK: Diagonal-Anchored Repulsive Knowledge Distillation for Vision-Language Models under Extreme Compression
Created by
Haebom
Category
Empty
์ ์
Numan Saeed, Asif Hanif, Fadillah Adamsyah Maani, Hussain Alasmawi, Mohammad Yaqub
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ์์ ํ๊ฒฝ์์ ์จ๋๋ฐ์ด์ค ๋ฐฐํฌ๋ฅผ ์ํ ๋น์ -์ธ์ด ๋ชจ๋ธ์ ๊ทน์ฌํ ์์ถ ์ ๋ฐ์ํ๋ ์ง์ ์ฆ๋ฅ(KD) ์ฑ๋ฅ ์ ํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ ํฉ๋๋ค. ์ด๋ฅผ ์ํด ์ ์๋ DARK(Diagonal-Anchored Repulsive Knowledge Distillation)๋ ํ์ต ๋ชฉํ๋ฅผ ๋๊ฐํญ(์ผ์นํ๋ ์ด๋ฏธ์ง-ํ ์คํธ ์)๊ณผ ๋น๋๊ฐํญ(๋นํ์ ์ ์ฌ์ฑ)์ผ๋ก ๋ถํดํ๋ ๋์กฐ์ KD ํ๋ ์์ํฌ์ ๋๋ค. DARK๋ ๋๊ฐํญ์ผ๋ก ์ผ์น ์ ์ ๋ ฌ์ ์ ์งํ๊ณ , ๋น๋๊ฐํญ ๊ฐ์ค์น๋ฅผ ์ ์ง์ ์ผ๋ก ์กฐ์ ํ์ฌ ๋ชจ๋ฐฉ์์ ๋นํ์ ์ ์ฌ์ฑ ๊ตฌ์กฐ๋ฅผ '๋ฐ๋ฐ'ํ๋๋ก ์ ๋ํจ์ผ๋ก์จ ๊ทน์ฌํ ์์ถ ํ๊ฒฝ์์ ํจ์จ์ ์ธ ์ฑ๋ฅ์ ๋ฌ์ฑํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
๊ทน์ฌํ ๋ชจ๋ธ ์์ถ ์, ๊ต์ฌ์ ๋ชจ๋ ์ ์ฌ์ฑ ๊ตฌ์กฐ๋ฅผ ๋ชจ๋ฐฉํ๋ ๋์ ํน์ ๊ตฌ์กฐ(์: ๋นํ์ ์ ์ฌ์ฑ)๋ฅผ ๋ฐ๋ฐํ๋๋ก ์ ๋ํ๋ ๊ฒ์ด ํจ์จ์ ์ธ ์ง์ ์ฆ๋ฅ ๋ฐฉ๋ฒ์ด ๋ ์ ์์ต๋๋ค.
โข
DARK๋ ๋์กฐ์ ํ์ต ๋ฐฉ์์ ํตํด ์ด๋ฏธ์ง-ํ ์คํธ ์์ ์ผ๊ด์ฑ์ ์ ์งํ๋ฉด์๋, ๊ต์ฌ์ ๋ถํ์ํ๊ฑฐ๋ ํผ๋์ ์ผ๊ธฐํ๋ ์ ์ฌ์ฑ ๊ตฌ์กฐ๋ฅผ ์ ๊ฑฐํ์ฌ ํ์ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํฅ์์ํต๋๋ค.
โข
์ ์๋ DARK ๋ฐฉ๋ฒ๋ก ์ ํตํด FetalCLIP ๋ชจ๋ธ์ 26๋ฐฐ ์์ ์๊ฐ ์ธ์ฝ๋๋ฅผ ๊ฐ์ง MobileFetalCLIP์ผ๋ก ์ฑ๊ณต์ ์ผ๋ก ์์ถํ์์ผ๋ฉฐ, ์ ๋ก์ท ์ฑ๋ฅ์์ ๊ต์ฌ ๋ชจ๋ธ์ ๋ฅ๊ฐํ๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ ์์ ํ๊ฒฝ์์์ ํ์ฉ ๊ฐ๋ฅ์ฑ์ ์ ์ฆํ์ต๋๋ค.
โข
๋ณธ ์ฐ๊ตฌ๋ ์ฃผ๋ก ๋น์ -์ธ์ด ๋ชจ๋ธ์ ๊ทน์ฌํ ์์ถ์ ์ด์ ์ ๋ง์ถ์์ผ๋ฉฐ, ๋ค๋ฅธ ์ข ๋ฅ์ ๋ชจ๋ธ์ด๋ ์์ถ ์์ค์์์ DARK์ ํจ๊ณผ์ ๋ํ ์ถ๊ฐ์ ์ธ ๊ฒ์ฆ์ด ํ์ํ ์ ์์ต๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage