본 논문은 의료 영상 분할에서 제로샷 성능이 뛰어나지 못한 기초 모델(예: Segment Anything Model, SAM)의 한계를 해결하기 위해, 합성 데이터 생성 프레임워크 SynthFM을 제안합니다. SynthFM은 의료 영상의 복잡한 특징(texture, contrast, noise)을 모방한 합성 데이터를 생성하여, 실제 의료 데이터 없이도 기초 모델을 적응시키는 것을 목표로 합니다. SAM의 사전 훈련된 인코더를 사용하고 디코더를 SynthFM의 데이터셋으로 새롭게 훈련시켜, 9개 데이터셋(CT, MRI, 초음파)의 11가지 해부학적 구조에 대한 실험을 진행했습니다. 그 결과, SynthFM은 SAM 및 MedSAM과 같은 제로샷 기준 모델보다 우수한 성능을 보였으며, 다양한 프롬프트 설정과 분포 외 데이터셋에서도 성능이 뛰어났습니다.