OUI Need to Talk About Weight Decay: A New Perspective on Overfitting Detection
Created by
Haebom
저자
Alberto Fernandez-Hernandez, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Orti
개요
본 논문은 딥 뉴럴 네트워크(DNN)의 훈련 역학을 모니터링하고 최적의 정규화 하이퍼파라미터를 식별하기 위한 새로운 도구인 과적합-과소적합 지표(OUI)를 제안합니다. OUI는 검증 데이터 없이 모델이 과적합 또는 과소적합되는지 여부를 나타냄으로써 가중치 감소(Weight Decay, WD) 하이퍼파라미터 선택을 효과적으로 안내할 수 있음을 검증합니다. CIFAR-100 데이터셋을 사용한 DenseNet-BC-100, TinyImageNet을 사용한 EfficientNet-B0, 그리고 ImageNet-1K를 사용한 ResNet-34에 대한 실험을 통해 OUI를 특정 구간 내에 유지하는 것이 일반화 성능 및 검증 점수 향상과 강하게 상관관계가 있음을 보여줍니다. 특히 OUI는 손실이나 정확도와 같은 기존 지표보다 훨씬 빠르게 수렴하여 훈련 초기 단계에서 최적의 WD 값을 식별할 수 있게 합니다. OUI를 신뢰할 수 있는 지표로 활용하여 훈련 초기에 선택한 WD 값이 모델을 과소적합, 과적합으로 이끄는지, 또는 검증 점수를 극대화하는 균형 있는 절충안을 이루는지를 판단할 수 있습니다. 이를 통해 테스트된 데이터셋과 DNN에 대해 최적의 성능을 위한 더욱 정확한 WD 조정이 가능합니다. 모든 코드는 https://github.com/AlbertoFdezHdez/OUI 에서 확인할 수 있습니다.