이 연구는 위암 분석을 위한 대규모 멀티모달 벤치마크 데이터셋인 Gastric-X를 소개합니다. Gastric-X는 환자의 CT 스캔, 내시경 이미지, 생화학 지표, 진단 노트, 종양 영역 주석 등 실제 임상 워크플로우를 반영하는 다양한 데이터를 포함합니다. 제안된 데이터셋은 시각적 질문 답변, 보고서 생성, 교차 모달 검색, 질병 분류, 병변 국소화 등 5가지 핵심 임상 작업을 통해 최신 비전-언어 모델(VLM)의 성능을 체계적으로 평가합니다.