본 논문은 초음파 영상 분석의 어려움을 해결하기 위해, 초음파 데이터만을 이용하여 자체 지도 학습(self-supervised learning) 기반의 대규모 모델 USF-MAE (Ultrasound Self-Supervised Foundation Model with Masked Autoencoding)를 제안합니다. USF-MAE는 OpenUS-46 데이터셋 (37만 개의 2D/3D 초음파 영상)을 사용하여 마스크된 자동 인코딩(masked autoencoding) 방식으로 사전 학습되었으며, 다양한 해부학적 영역을 포괄합니다. 사전 학습된 인코더는 유방암, 난소 종양, 위장관 기질 종양 분류 벤치마크에서 기존 CNN 및 ViT 모델보다 우수한 성능을 보였고, 지도 학습 모델인 UltraSam과 유사하거나 더 나은 성능을 달성했습니다.