Sign In

IBNorm: Information-Bottleneck Inspired Normalization for Representation Learning

Created by
  • Haebom
Category
Empty

저자

Xiandong Zou, Pan Zhou

개요

IBNorm은 정보 병목 원리를 기반으로 하는 간단하지만 강력한 정규화 기법이다. 기존의 분산 중심 정규화 방식과 달리, 예측 관련 정보를 보존하면서 불필요한 변동성을 억제하는 압축 연산을 도입하여 더 유익한 표현을 유도한다. IBNorm은 표준 정규화의 안정성과 호환성을 유지하면서, 이론적으로는 기존 방식보다 더 높은 정보 병목 값과 더 좁은 일반화 범위를 달성하고, 대규모 언어 모델(LLaMA, GPT-2) 및 비전 모델(ResNet, ViT)에서 BatchNorm, LayerNorm, RMSNorm보다 일관적으로 뛰어난 성능을 보인다.

시사점, 한계점

시사점:
정보 병목 원리를 활용한 새로운 정규화 방식 제시
이론적 분석을 통해 기존 방식 대비 우위 입증
다양한 모델 및 데이터셋에서 일관된 성능 향상
상호 정보 분석을 통해 정보 병목 행동 우수성 확인
한계점:
구체적인 IBNorm 알고리즘 구현 및 하이퍼파라미터 설정에 대한 추가적인 연구 필요
코드 공개 예정이나, 현재까지는 미공개 상태
👍