본 논문은 지구 관측(EO)을 위한 비전 기반 모델 개발에 자가 지도 학습(SSL)을 활용하며, 특히 데이터셋 구성, 즉 사전 훈련 데이터셋의 균형과 다양성 확보에 중점을 둡니다. 기존 연구들이 주로 네트워크 구조와 훈련 전략에 집중한 것과 달리, 본 논문은 위성 영상의 중복성과 긴 꼬리 분포로 인해 발생하는 편향된 표현과 비효율적인 훈련 문제를 해결하고자, 데이터셋 다양성과 균형을 극대화하는 동적 데이터셋 가지치기 전략을 제안합니다. 이 방법은 기존의 특징 추출기 없이 반복적으로 훈련 세트를 개선하며, 특히 정제된 데이터셋이 제한적이거나 없는 분야에 적합합니다. Sentinel-1 Wave Mode (WV) SAR 아카이브를 사용하여 10년 간의 데이터로 모델을 처음부터 훈련시키고, 세 가지 하위 작업에서 계산 효율성과 표현 품질을 향상시켜 전이 성능을 강화함을 보여줍니다. 또한, SAR 영상을 사용한 해양 관측 및 분석을 위한 기반 모델 시리즈인 Nereus의 첫 번째 모델인 Nereus-SAR-1의 가중치를 공개합니다.