본 연구는 의료 영상 진단 및 해석에 있어 전문 의료 Vision Language Model (VLM)과 일반 VLM의 상호 보완적인 강점을 강조합니다. 전문 의료 VLM은 특정 모달리티에 특화된 경우 유용하지만, 효율적으로 미세 조정된 일반 VLM은 특히 미지 또는 희귀한 OOD 의료 모달리티로 전이하는 경우 대부분의 과제에서 동등하거나 더 나은 성능을 달성할 수 있음을 보여줍니다. 따라서 전문적인 의료 사전 학습의 부족으로 제한되는 것이 아니라, 일반 VLM이 임상 AI 개발을 위한 확장 가능하고 비용 효율적인 경로를 제공할 수 있음을 시사합니다.