본 논문은 의료 영상 분석을 위한 지능형 멀티모달 프레임워크를 제시한다. 이 프레임워크는 CT, MRI, X-ray, 초음파를 포함한 여러 영상 모달리티에서 Google Gemini 2.5 Flash를 활용하여 자동 종양 감지 및 임상 보고서 생성을 수행한다. 시각적 특징 추출과 자연어 처리를 결합하여 상황별 이미지 해석을 가능하게 하며, 좌표 검증 메커니즘과 확률적 가우시안 모델링을 통해 이상 분포를 분석한다. 또한, 다층 시각화 기술을 통해 상세한 의료 일러스트레이션, 비교 오버레이, 통계적 표현을 생성하여 임상적 신뢰도를 높인다. 실험 결과는 여러 모달리티에서 높은 이상 감지 성능을 보였으며, 사용자 친화적인 Gradio 인터페이스를 통해 임상 워크플로우에 통합된다. 제로샷 학습 능력을 통해 대규모 데이터 세트에 대한 의존성을 줄인다.