딥러닝 모델의 적대적 공격 취약성을 완화하기 위해 제안된 DeepDefense 프레임워크는 Gradient-Feature Alignment (GFA) 정규화를 여러 계층에 적용합니다. DeepDefense는 입력 그래디언트를 내부 특징 표현과 정렬하여 접선 방향에서 손실 풍경을 부드럽게 만들어 적대적 노이즈에 대한 모델의 민감도를 줄입니다. 이론적 분석을 통해 적대적 공격을 방사형 및 접선 성분으로 분해하고, 정렬이 대부분의 공격이 효과적인 접선 방향의 손실 변화를 억제한다는 것을 보여줍니다.