본 논문은 대규모 비전 모델 DINOv2의 자체 훈련 전략을 제안한다. 특히, 계산 부담을 줄이면서도 일반적인 손상에 대한 강건성을 강화하는 데 초점을 맞춘다. 제안된 방법은 저주파수부터 시작하는 주파수 필터링 커리큘럼과 가우시안 노이즈 패칭 증강을 사용한다. ImageNet-1K에서 훈련된 ViT-B/16 백본에 적용했을 때, 훈련 시간과 FLOPs를 각각 1.6배, 2.25배 줄이면서도, 손상 벤치마크(ImageNet-C)에서 동등한 강건성을 달성하고 선형 프로빙 성능을 유지한다.