본 논문은 계산 병리학(CPath)에서 다중 모달 기반 모델의 최신 동향을 종합적으로 검토한 논문입니다. 특히 헤마톡실린-에오신(H&E) 염색 전체 슬라이드 이미지(WSI) 및 타일 수준 표현을 기반으로 구축된 모델에 중점을 두고 있습니다. 32개의 최첨단 다중 모달 기반 모델을 시각-언어, 시각-지식 그래프, 시각-유전자 발현의 세 가지 주요 패러다임으로 분류하고, 시각-언어 모델을 LLM 기반 및 비 LLM 기반으로 추가 분류합니다. 또한 병리학에 맞춰 제작된 28개의 다중 모달 데이터 세트(이미지-텍스트 쌍, 지시 데이터 세트, 이미지-다른 모달리티 쌍)를 분석하고, 하위 작업 분류, 훈련 및 평가 전략, 주요 과제 및 미래 방향을 제시합니다. 병리학과 AI의 교차점에서 연구하는 연구자와 실무자를 위한 귀중한 자료를 제공하는 것을 목표로 합니다.