Este artículo presenta el modelo ViTa, que integra la resonancia magnética cardíaca (RMC) con factores de salud a nivel de paciente para facilitar una comprensión integral de la salud cardíaca y la interpretación personalizada del riesgo de enfermedad. Aprovechando los datos de 42.000 participantes del Biobanco del Reino Unido, integramos datos de imágenes de pila de cine 3D+T en vistas de eje corto y eje largo con factores tabulares detallados a nivel de paciente. Este paradigma multimodal admite múltiples subtareas, como la predicción del fenotipo cardíaco y las características fisiológicas, la segmentación y la clasificación de enfermedades cardíacas y metabólicas, dentro de un marco único e integrado. Mediante el aprendizaje de una representación latente compartida que conecta las características ricas de la imagen con el contexto del paciente, buscamos proporcionar una comprensión específica de la salud cardíaca para cada paciente, más allá de los modelos existentes específicos para cada tarea.