haebom
Sign In
MCLR: Improving Conditional Modeling via Inter-Class Likelihood-Ratio Maximization and Unifying Classifier-Free Guidance with Alignment Objectives
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Xiang Li, Yixuan Jia, Xiao Li, Jeffrey A. Fessler, Rongrong Wang, Qing Qu
๐ก ๊ฐ์
์ด ๋ ผ๋ฌธ์ ํ์ฐ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํฅ์์ํค๊ธฐ ์ํด ๊ธฐ์กด์ ํ์ค denoising score matching(DSM)์ ํ๊ณ์ ์ผ๋ก ์ง์ ๋๋ ํด๋์ค ๊ฐ ๋ถ๋ฆฌ ๋ถ์กฑ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ ํฉ๋๋ค. ์ด๋ฅผ ์ํด ํด๋์ค ๊ฐ ์ฐ๋๋น(likelihood-ratio)๋ฅผ ์ต๋ํํ๋ ์๋ก์ด ํ๋ จ ๋ชฉํ์ธ MCLR(Maximizing Inter-Class Likelihood-Ratios)์ ์ ์ํ๋ฉฐ, ์ด๋ฅผ ํตํด ์ถ๋ก ์ classifier-free guidance(CFG) ์์ด๋ ์ ์ฌํ ์ฑ๋ฅ ํฅ์์ ์ป์ ์ ์์์ ๋ณด์ฌ์ค๋๋ค. ๋ ๋์๊ฐ, MCLR์ด CFG์ ์ด๋ก ์ ๊ธฐ๋ฐ๊ณผ ์ฐ๊ฒฐ๋์ด ์์์ ์ฆ๋ช ํ๋ฉฐ CFG๋ฅผ ์ ๋ ฌ ๊ธฐ๋ฐ ๋ชฉํ๋ฅผ ํตํด ์ค๋ช ํฉ๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
๊ธฐ์กด ํ์ฐ ๋ชจ๋ธ ํ๋ จ ๋ฐฉ์์ ๊ทผ๋ณธ์ ์ธ ๋ฌธ์ ์ ์ธ ํด๋์ค ๊ฐ ๋ถ๋ฆฌ ๋ถ์กฑ์ ํจ๊ณผ์ ์ผ๋ก ๊ฐ์ ํ์ฌ, ๋ณ๋์ ์ถ๋ก ์๊ฐ ๊ธฐ๋ฒ ์์ด๋ ์์ฑ ํ์ง์ ๋์ผ ์ ์์ต๋๋ค.
โข
์ ์ํ๋ MCLR ํ๋ จ ๋ชฉํ๊ฐ ์ถ๋ก ์๊ฐ CFG์ ํจ๊ณผ๋ฅผ ๋ด์ฌํํจ์ผ๋ก์จ, ํ๋ จ ๋จ๊ณ์์๋ถํฐ ๋ชจ๋ธ์ ์กฐ๊ฑด๋ถ ์์ฑ ๋ฅ๋ ฅ์ ๊ฐํํ ์ ์์ต๋๋ค.
โข
CFG์ ์ด๋ก ์ ํด์์ ์ ๊ณตํ๊ณ , ์ ๋ ฌ ๊ธฐ๋ฐ ๋ชฉํ์์ ์ฐ๊ฒฐ์ฑ์ ๊ท๋ช ํ์ฌ ํ์ฐ ๋ชจ๋ธ ํ๋ จ ๋ฐ ์ ๋์ ๋ํ ์๋ก์ด ์ดํด๋ฅผ ์ ์ํฉ๋๋ค.
โข
์ ์๋ MCLR์ด ๋ชจ๋ ์ข ๋ฅ์ ํ์ฐ ๋ชจ๋ธ๊ณผ ๋ฐ์ดํฐ์ ์ ๋ํด CFG์ ๋์ผํ๊ฑฐ๋ ๋ ๋์ ์ฑ๋ฅ์ ๋ณด์ฅํ๋์ง์ ๋ํ ์ถ๊ฐ์ ์ธ ๊ฒ์ฆ์ด ํ์ํ ์ ์์ต๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage