Bài báo này trình bày mô hình ViTa, tích hợp hình ảnh cộng hưởng từ tim (CMR) với các yếu tố sức khỏe ở cấp độ bệnh nhân để cho phép hiểu biết toàn diện về sức khỏe tim mạch và diễn giải rủi ro bệnh tật được cá nhân hóa. Sử dụng dữ liệu từ 42.000 người tham gia UK Biobank, chúng tôi tích hợp dữ liệu hình ảnh chồng cine 3D+T trong chế độ xem trục ngắn và trục dài với các yếu tố ở cấp độ bệnh nhân dạng bảng chi tiết. Mô hình đa phương thức này hỗ trợ nhiều tác vụ phụ, bao gồm dự đoán kiểu hình tim và đặc điểm sinh lý, phân đoạn, và phân loại bệnh tim và chuyển hóa, trong một khuôn khổ tích hợp duy nhất. Bằng cách học một biểu diễn tiềm ẩn chung kết nối các đặc điểm hình ảnh phong phú với bối cảnh của bệnh nhân, chúng tôi hướng đến việc cung cấp hiểu biết cụ thể về sức khỏe tim mạch cho bệnh nhân, vượt ra ngoài các mô hình tác vụ cụ thể hiện có.