본 논문은 심장 자기 공명 영상(CMR)과 환자 수준의 건강 요인(인구 통계, 대사, 생활 습관 등)을 통합하여 심장 건강을 포괄적으로 이해하고 개인의 질병 위험을 정확하게 해석하는 것을 목표로 하는 ViTa 모델을 제시합니다. ViTa는 UK Biobank의 42,000명 참가자 데이터를 활용하여 단축 및 장축 뷰의 3D+T cine stacks 영상 데이터와 상세한 표 형태의 환자 수준 요인을 통합합니다. 이를 통해 심장 표현형 및 생리적 특징 예측, 분할, 심장 및 대사 질환 분류 등 다양한 하위 작업을 단일 통합 프레임워크 내에서 지원합니다. 기존의 작업별 모델을 넘어 풍부한 영상 특징과 환자 맥락을 연결하는 공유 잠재 표현을 학습하여 환자 특이적 심장 건강 이해를 제공함으로써 임상 유용성과 확장성을 향상시키는 잠재력을 보여줍니다.