본 논문은 근골격 방사선 사진의 이상 감지를 위한 MedGemma 기반 프레임워크를 제안합니다. 기존의 오토인코더 및 신경망 파이프라인에서 벗어나, 다양한 의료 영상 모달리티에 대해 사전 훈련된 SigLIP 기반 비전 인코더를 통합한 MedGemma 기반 모델을 활용합니다. 전처리된 X-ray 이미지는 MedGemma 비전 백본을 사용하여 고차원 임베딩으로 인코딩되고, 이 임베딩은 이진 분류를 위해 경량 다층 퍼셉트론에 전달됩니다. 실험 결과는 MedGemma 기반 분류기가 기존의 컨볼루션 및 오토인코더 기반 지표를 능가하는 강력한 성능을 보임을 보여줍니다. 또한, 모델은 MedGemma의 전이 학습 기능을 활용하여 일반화 성능을 향상시키고 특징 엔지니어링을 최적화합니다. 최신 의료 기반 모델의 통합은 표현 학습을 향상시킬 뿐만 아니라, 효율적인 도메인 적응을 위한 선택적 인코더 블록 언프리징과 같은 모듈식 훈련 전략을 용이하게 합니다.