본 논문은 의료 영상에 대한 확장 가능한 의료 비전 기초 모델 개발을 위한 모델 크기, 학습 알고리즘, 데이터 크기 및 영상 유형에 걸친 확장 동작을 자기 지도 학습을 통해 탐구합니다. 대규모 사전 학습을 지원하기 위해 다양한 생의학 영상 유형과 해부학적 구조를 포함하는 대규모 생의학 영상 데이터셋 BioVFM-21M을 소개합니다. 실험 결과, 확장은 이점을 제공하지만 작업에 따라 다르다는 것을 보여주며, 확장 이점과 상관관계가 있는 여러 요소를 밝힙니다. 마지막으로, 2100만 개의 생의학 영상으로 사전 학습된 대규모 의료 비전 기초 모델 BioVFM을 제시하며, 이는 12개의 의료 벤치마크에서 이전 최첨단 기초 모델보다 성능이 우수함을 보여줍니다. 결론적으로, 확장은 성능 향상에 유익하지만, 작업 특성, 데이터 다양성, 사전 학습 방법 및 계산 효율성이 확장 가능한 의료 기초 모델 개발에 중요한 고려 사항임을 강조합니다.