haebom
Sign In
MANGO: Meta-Adaptive Network Gradient Optimization for Online Continual Learning
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Ankita Awasthi, Marco Apolinario, Kaushik Roy
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ์ค์๊ฐ์ผ๋ก ๋ณํํ๋ ๋ฐ์ดํฐ ์คํธ๋ฆผ์์ ์ด์ ์ง์์ ์์ง ์๊ณ ์๋ก์ด ์ ๋ณด๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํ์ตํ๋ ์จ๋ผ์ธ ์ง์ ํ์ต(OCL) ๋ฌธ์ ๋ฅผ ๋ค๋ฃน๋๋ค. ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด, ์ ์๋ MANGO๋ ํ๋ผ๋ฏธํฐ ์ ๋ฐ์ดํธ์ ๋ฏผ๊ฐ๋์ ๊ธฐ๋ฐํ ๊ฒฝ์ฌ๋ ๊ฒ์ดํ (gradient-gating)๊ณผ ์ฌํ ๋ฒํผ(replay buffer)์ ํจ๊ณผ๋ฅผ ํ๊ฐํ์ฌ ์์ ์ฑ ๊ณ์๋ฅผ ์กฐ์ ํ๋ ๋ฉํ ํ์ต๋ ์ ๊ทํ(meta-learned regularization)๋ฅผ ํตํด ์์ ์ฑ๊ณผ ์ ์ฐ์ฑ์ ๊ท ํ์ ๋ง์ถฅ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
MANGO๋ ๊ธฐ์กด OCL ๋ฐฉ๋ฒ๋ก ์ ํ๊ณ์ (์ฌํ ์ํ ํธํฅ, ์ถ๋ ฅ ์์ค์ ์ ์ฝ, ๊ณ ์ ๋ ์ ๊ทํ, ํผ๋๋ฐฑ ๋ถ์กฑ)์ ์ฑ๊ณต์ ์ผ๋ก ํด๊ฒฐํฉ๋๋ค.
โข
๊ฒฝ์ฌ๋ ๊ฒ์ดํ ๊ณผ ๋ฉํ ํ์ต๋ ์ ๊ทํ๋ฅผ ๊ฒฐํฉํ์ฌ ํ๋ผ๋ฏธํฐ ์ ๋ฐ์ดํธ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ์ ์ดํจ์ผ๋ก์จ, ์ฌํ ์ํ ํฌ๊ธฐ์ ๊ด๊ณ์์ด ์ผ๊ด๋ ์ฑ๋ฅ์ ๋ณด์ด๋ฉฐ ์ต์ ๊ธฐ์ (state-of-the-art)์ ๋ฌ์ฑํฉ๋๋ค.
โข
Domain incremental learning ๋ฐ class incremental learning ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ์ ์์ ๊ธฐ์กด ๋ฐฉ๋ฒ๋ค ๋๋น ์ฐ์ํ ์ ํ๋๋ฅผ ๋ฌ์ฑํ๊ณ , ๊ธ์ ์ ์ธ Backward Transfer๋ฅผ ๋ณด์ฌ ์ด์ ํ์ต ๋ด์ฉ์ ์๋ ๋ฌธ์ ๋ฅผ ๊ทน๋ณตํ์ต๋๋ค.
โข
๋ ผ๋ฌธ์์๋ MANGO์ ๊ณ์ฐ ๋ณต์ก์ฑ์ด๋ ์ค์ ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ์์์ ํ์ฅ์ฑ์ ๋ํ ์์ธํ ๋ถ์์ด ๋ถ์กฑํ ์ ์์ผ๋ฉฐ, ๋ฉํ ํ์ต ๊ณผ์ ์์ฒด์ ํจ์จ์ฑ ์ฆ๋ ๋ฐ ๋ค๋ฅธ ์ง์ ํ์ต ์ค์ (์: task incremental learning)์ผ๋ก์ ํ์ฅ ๊ฐ๋ฅ์ฑ์ ๋ํ ์ถ๊ฐ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage