본 논문은 다중 모달 의료 영상 분석을 위한 새로운 자기 지도 학습 방법을 제시합니다. 기존의 단일 모달 자기 지도 학습 방식의 한계를 극복하고자, 다중 모달 뇌 MRI 스캔 (240만장 이상의 이미지, 3,755명 환자의 16,022개 스캔)을 이용하여 교차 모달 표현 학습을 위한 세 가지 프록시 태스크 (교차 모달 이미지 재구성, 모달 인식 대조 학습, 모달 템플릿 증류) 기반의 다중 모달 이미지 사전 학습을 진행합니다. 다양한 벤치마크 (10개의 하위 작업)를 통한 실험 결과, 제안된 방법은 기존 최첨단 사전 학습 방법에 비해 6가지 분할 벤치마크에서 Dice Score를 0.28%-14.47% 향상시키고, 4가지 개별 이미지 분류 작업에서 정확도를 0.65%-18.07% 향상시키는 우수한 성능을 보였습니다.