본 논문은 비전 트랜스포머(ViTs)의 주요 한계점인 주파수 소실 문제를 해결하기 위해 주파수 동적 어텐션 변조(FDAM) 기법을 제안합니다. 기존 ViTs의 어텐션 메커니즘은 저주파 필터 역할을 하여 세부적인 정보와 질감이 손실되는 문제가 있는데, FDAM은 어텐션 행렬을 역전시켜 고주파 필터링을 생성하는 어텐션 역전(AttInv)과 다양한 주파수 성분에 가중치를 부여하는 주파수 동적 스케일링(FreqScale) 두 가지 기술을 통해 ViTs의 주파수 응답을 직접 조절합니다. SegFormer, DeiT, MaskDINO 등 다양한 모델에서 의미론적 분할, 객체 탐지, 인스턴스 분할 등의 과제에서 성능 향상을 보이며, 특히 원격 감지 탐지 분야에서 최첨단 성능을 달성합니다.