Satya Prakash Dash, Hossein Abdi, Wei Pan, Samuel Kaski, Mingfei Sun
💡 개요
본 연구는 모델의 일반화 성능 향상에 기여하는 경사도 정규화(GR)를 자연 경사법(Natural Gradient Descent)과 통합하여 최적화 속도를 높이는 새로운 2차 옵티마이저 계열인 GRNG(Gradient-Regularized Natural Gradients)를 제안합니다. GRNG는 명시적으로 경사도 규범을 최소화하는 RENG와 암묵적으로 규제화를 통합하는 RING 알고리즘, 그리고 FIM 역행렬을 제거하는 베이즈 변형을 포함합니다.
🔑 시사점 및 한계
•
경사도 정규화가 2차 옵티마이저의 안정성을 개선하고 전역 최적해로의 수렴을 가능하게 함을 이론적으로 입증했습니다.
•
제안된 GRNG는 기존 1차 및 2차 옵티마이저 대비 더 빠른 최적화 속도와 향상된 일반화 성능을 보여주었습니다.
•
실제 비전 및 언어 벤치마크에서 GRNG의 우수성을 경험적으로 검증했습니다.
•
제안된 알고리즘의 계산 복잡성 및 대규모 모델 적용 시의 확장성에 대한 추가적인 연구가 필요합니다.