Right Time to Learn:Promoting Generalization via Bio-inspired Spacing Effect in Knowledge Distillation
Created by
Haebom
저자
Guanglong Sun, Hongwei Yan, Liyuan Wang, Qian Li, Bo Lei, Yi Zhong
개요
본 논문은 생물학적 학습 및 기억에서의 간격 효과 이론에서 영감을 받아, 온라인 지식 증류(KD)와 자기 지식 증류(self-KD)의 효과를 향상시키는 새로운 전략인 Spaced KD를 제안합니다. Spaced KD는 학생 모델이 시간 간격을 두고 훈련된 교사 모델로부터 지식을 증류하는 방법입니다. 이론적 및 실험적 분석을 통해 Spaced KD의 이점이 확률적 경사 하강법(SGD) 중 더 평평한 손실 지형으로의 수렴에서 비롯됨을 보여줍니다. Tiny-ImageNet 데이터셋에서 온라인 KD 및 자기 KD에 비해 최대 2.31%와 3.34%의 성능 향상을 달성하며, Spaced KD의 효과를 검증하는 광범위한 실험 결과를 제시합니다. 소스 코드는 Github에 공개되어 있습니다.