본 논문은 의료 영상 분석 분야, 특히 병리학 분야에서의 비전-언어 모델(VLMs)의 한계를 지적하고, 이를 극복하기 위해 고품질의 추론 중심 데이터셋과 새로운 모델을 제시합니다. 기존 병리학 VLMs는 진단 정확도와 추론의 타당성 측면에서 한계를 보이는데, 이는 기존 데이터셋이 실제 병리학자의 진단 과정을 충분히 반영하지 못하기 때문입니다. 본 연구에서는 병리학 교과서와 전문가의 지식을 활용하여 고품질 데이터셋을 구축하고, 이를 기반으로 3단계 학습 파이프라인(지식 주입을 위한 사전 학습, 추론 유도를 위한 지도 학습, 강화 학습)을 통해 병리학 추론 모델 Patho-R1을 제시합니다. 또한, 데이터셋의 정합성 평가를 위해 Patho-CLIP 모델도 제시합니다. 실험 결과, Patho-CLIP과 Patho-R1은 제로샷 분류, 교차 모드 검색, 시각적 질문 응답, 객관식 질문 등 다양한 병리학 관련 과제에서 우수한 성능을 보였습니다.