Sign In

SkillFactory: Self-Distillation For Learning Cognitive Behaviors

Created by
  • Haebom
Category
Empty

์ €์ž

Zayne Sprague, Jack Lu, Manya Wadhwa, Sedrick Keh, Mengye Ren, Greg Durrett

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ๊ธฐ์กด ์–ธ์–ด ๋ชจ๋ธ์ด ๊ฐ–์ถ”์ง€ ๋ชปํ•œ ์ธ์ง€ ๋Šฅ๋ ฅ์„ ๊ฐ•ํ™”ํ•˜๊ธฐ ์œ„ํ•œ ์ƒˆ๋กœ์šด ํ•™์Šต ๋ฐฉ๋ฒ•๋ก ์ธ SkillFactory๋ฅผ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. SkillFactory๋Š” ๋ชจ๋ธ ์Šค์Šค๋กœ ์ƒ์„ฑํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ๊ฐ•ํ™”ํ•™์Šต(RL) ์ด์ „์— ์ง€๋„ ํ•™์Šต(SFT) ๋‹จ๊ณ„์—์„œ ์ธ์ง€ ๊ธฐ์ˆ ์„ ํšจ๊ณผ์ ์œผ๋กœ ํ•™์Šต์‹œํ‚ต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ์€ ๋ณต์žกํ•œ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ณ , ํŠนํžˆ RL ์ดํ›„ ๋” ์–ด๋ ค์šด ๊ณผ์ œ์— ๋Œ€ํ•œ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ๋†’์ด๋Š” ์„ฑ๊ณผ๋ฅผ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
๋ชจ๋ธ ์ž์ฒด ์ƒ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•œ ์ž์ฒด ์ฆ๋ฅ˜(Self-Distillation) ๋ฐฉ์‹์„ ํ†ตํ•ด ์™ธ๋ถ€์˜ ๊ฐ•๋ ฅํ•œ ๋ชจ๋ธ ์—†์ด๋„ ์ธ์ง€ ๊ธฐ์ˆ  ํ•™์Šต์„ ํšจ๊ณผ์ ์œผ๋กœ ์œ ๋„ํ•  ์ˆ˜ ์žˆ์Œ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
โ€ข
RL ์ด์ „ ๋‹จ๊ณ„์—์„œ ํ•™์Šต๋œ ๊ท€๋‚ฉ์  ํŽธํ–ฅ(Inductive Bias)์ด ๋ชจ๋ธ์˜ ๊ฒฌ๊ณ ํ•œ ์ธ์ง€ ๊ธฐ์ˆ  ํ™œ์šฉ์— ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•œ๋‹ค๋Š” ๊ฒƒ์„ ์ž…์ฆํ•ฉ๋‹ˆ๋‹ค.
โ€ข
SkillFactory๋กœ ์ดˆ๊ธฐํ™”๋œ ๋ชจ๋ธ์€ RL ์ดํ›„ ํ•™์Šต๋˜์ง€ ์•Š์€ ๋„๋ฉ”์ธ ์™ธ ๊ณผ์ œ์— ๋Œ€ํ•ด์„œ๋„ ๋” ๋‚˜์€ ๊ฐ•๊ฑด์„ฑ(Robustness)์„ ๋ณด์ž…๋‹ˆ๋‹ค.
โ€ข
์ž์ฒด ์ƒ์„ฑ๋œ "์€์ƒ‰" SFT ํŠธ๋ ˆ์ด์Šค ๋ฐ์ดํ„ฐ๋Š” ์™„๋ฒฝํ•˜์ง€ ์•Š์„ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด๋Ÿฌํ•œ ๋ถˆ์™„์ „์„ฑ์ด ํ•™์Šต ๊ณผ์ •์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์— ๋Œ€ํ•œ ์ถ”๊ฐ€ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
๐Ÿ‘