본 논문은 의료 영상 분석 분야에서 대규모 라벨 데이터에 대한 의존성을 줄이기 위해 자기 지도 학습 기법과 도메인 적응 방법을 개발하는 연구를 제시한다. Medformer라는 새로운 신경망 아키텍처를 개발하여 다양한 의료 영상 데이터셋에 대한 사전 학습, 다양한 크기와 모달리티 처리, 동적 입출력 적응 메커니즘을 가능하게 한다. 이를 통해 2D X-ray부터 3D MRI까지 다양한 의료 영상 유형을 효율적으로 처리하고 통합하여 라벨 데이터 의존성을 완화한다. 또한, 비지도 데이터를 활용하여 의미 있는 정보를 추출하는 새로운 사전 작업(pretext tasks)을 제시하여 모델의 해석 능력을 향상시키고, MedMNIST 데이터셋을 통해 검증한다.