Sign In

SURGE: Surrogate Gradient Adaptation in Binary Neural Networks

์ž‘์„ฑ์ž
  • Haebom
์นดํ…Œ๊ณ ๋ฆฌ
Empty

์ €์ž

Haoyu Huang, Boyu Liu, Linlin Yang, Yanjing Li, Yuguang Yang, Xuhui Liu, Canyu Chen, Zhongqian Fu, Baochang Zhang

๐Ÿ’ก ๊ฐœ์š”

์ด ์—ฐ๊ตฌ๋Š” ์ด์ง„ ์‹ ๊ฒฝ๋ง(BNN) ํ•™์Šต ์‹œ ํ•„์—ฐ์ ์œผ๋กœ ๋ฐœ์ƒํ•˜๋Š” ๋ฏธ๋ถ„ ๋ถˆ๊ฐ€๋Šฅํ•œ ์ด์ง„ํ™” ์—ฐ์‚ฐ์œผ๋กœ ์ธํ•œ ๊ธฐ์šธ๊ธฐ ๊ทผ์‚ฌ ๋ฌธ์ œ์ ์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด SURGE(SURrogate GradiEnt Adaptation)๋ผ๋Š” ์ƒˆ๋กœ์šด ํ•™์Šต ๊ฐ€๋Šฅํ•œ ๊ธฐ์šธ๊ธฐ ๋ณด์ƒ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. SURGE๋Š” ๋ณด์กฐ์ ์ธ ์—ญ์ „ํŒŒ์™€ ์ด์ค‘ ๊ฒฝ๋กœ ๊ธฐ์šธ๊ธฐ ๋ณด์ƒ๊ธฐ(DPGC)๋ฅผ ํ†ตํ•ด ๊ธฐ์šธ๊ธฐ ๋ถˆ์ผ์น˜๋ฅผ ์™„ํ™”ํ•˜๊ณ , ์ ์‘ํ˜• ๊ธฐ์šธ๊ธฐ ์Šค์ผ€์ผ๋Ÿฌ(AGS)๋ฅผ ํ™œ์šฉํ•˜์—ฌ ํ•™์Šต ์•ˆ์ •์„ฑ์„ ๋†’์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜, ๊ฐ์ฒด ํƒ์ง€, ์–ธ์–ด ์ดํ•ด ๋“ฑ ๋‹ค์–‘ํ•œ ๊ณผ์ œ์—์„œ ์ตœ์‹  ๊ธฐ์ˆ  ๋Œ€๋น„ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
SURGE๋Š” ๊ธฐ์กด์˜ ์ˆ˜์ž‘์—…์œผ๋กœ ์„ค๊ณ„๋œ ๊ธฐ์šธ๊ธฐ ์ถ”์ • ๋ฐฉ์‹์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ณ , ์ด๋ก ์  ๊ธฐ๋ฐ˜์„ ๊ฐ–์ถ˜ ํ•™์Šต ๊ฐ€๋Šฅํ•œ ๋ฐฉ์‹์œผ๋กœ BNN์˜ ํ•™์Šต ํšจ์œจ์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
โ€ข
DPGC๋ฅผ ํ†ตํ•œ ๋ณด์กฐ ์ „์ฒด ์ •๋ฐ€๋„ ๊ฒฝ๋กœ ํ™œ์šฉ์€ ๊ธฐ์šธ๊ธฐ ์ •๋ณด ์†์‹ค์„ ์ค„์ด๊ณ  ํŽธํ–ฅ์ด ์ ์€ ๊ธฐ์šธ๊ธฐ ์ถ”์ •์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜์—ฌ BNN ์„ฑ๋Šฅ ํ–ฅ์ƒ์˜ ์ค‘์š”ํ•œ ๊ธฐ๋ฐ˜์ด ๋ฉ๋‹ˆ๋‹ค.
โ€ข
AGS๋Š” ๋™์ ์œผ๋กœ ๊ธฐ์šธ๊ธฐ ๊ธฐ์—ฌ๋„๋ฅผ ์กฐ์ ˆํ•˜์—ฌ ํ•™์Šต ๋ถˆ์•ˆ์ •์„ฑ์„ ์™„ํ™”ํ•˜๊ณ  ์ „๋ฐ˜์ ์ธ ํ•™์Šต ๊ณผ์ •์„ ์•ˆ์ •ํ™”ํ•˜๋Š” ๋ฐ ๊ธฐ์—ฌํ•ฉ๋‹ˆ๋‹ค.
โ€ข
์ œ์•ˆ๋œ ๋ฐฉ๋ฒ•๋ก ์€ ๊ธฐ์กด์˜ ์ตœ์‹  BNN ํ•™์Šต ๊ธฐ๋ฒ•๋“ค๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ด์ง€๋งŒ, ๋ณต์žกํ•œ ๋ชจ๋ธ ๊ตฌ์กฐ๋‚˜ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹์— ๋Œ€ํ•œ ์ถ”๊ฐ€์ ์ธ ๊ฒ€์ฆ ๋ฐ ์ตœ์ ํ™”๊ฐ€ ํ•„์š”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
๐Ÿ‘