Frequency Dynamic Convolution for Dense Image Prediction
Created by
Haebom
Category
Empty
저자
Linwei Chen, Lin Gu, Liang Li, Chenggang Yan, Ying Fu
개요
Dynamic Convolution (DY-Conv)은 주의 메커니즘과 병렬 가중치를 이용하여 적응적인 가중치 선택을 가능하게 하지만, 가중치의 주파수 응답이 유사하여 매개변수 비용이 높고 적응성이 제한적입니다. 본 논문에서는 주파수 영역에서 고정된 매개변수 예산을 학습하는 새로운 방법인 Frequency Dynamic Convolution (FDConv)을 제시합니다. FDConv는 이 예산을 서로 다른 푸리에 지수를 가진 주파수 기반 그룹으로 나누어 매개변수 비용을 증가시키지 않고 주파수 다양성을 가진 가중치를 생성합니다. 적응성을 더욱 향상시키기 위해 Kernel Spatial Modulation (KSM)과 Frequency Band Modulation (FBM)을 제안합니다. KSM은 공간 수준에서 각 필터의 주파수 응답을 동적으로 조정하고, FBM은 주파수 영역에서 가중치를 별개의 주파수 대역으로 분해하여 국지적 콘텐츠에 따라 동적으로 변조합니다. 객체 탐지, 분할 및 분류에 대한 광범위한 실험을 통해 FDConv의 효과를 검증합니다. ResNet-50에 적용했을 때, FDConv는 +3.6M 매개변수의 적당한 증가로 우수한 성능을 달성하며, 상당한 매개변수 증가가 필요한 기존 방법(예: CondConv +90M, KW +76.5M)보다 뛰어난 성능을 보입니다. 또한, FDConv는 ConvNeXt, Swin-Transformer 등 다양한 아키텍처에 원활하게 통합되어 현대 비전 작업에 유연하고 효율적인 솔루션을 제공합니다. 코드는 https://github.com/Linwei-Chen/FDConv 에서 공개적으로 이용 가능합니다.