Para abordar los desafíos de la evaluación de resultados abierta de modelos multimodales a gran escala, este artículo propone UFEval, un evaluador de grano fino que integra múltiples tareas y aspectos. UFEval se basa en una taxonomía jerárquica de aspectos que abarca 112 aspectos de grano fino en cuatro tareas: generación de lenguaje natural, comprensión de imágenes, generación de imágenes y generación de texto cruzado e imágenes. UFEval se entrenó en FRABench, un conjunto de datos de evaluación de grano fino compuesto por 64 000 muestras de comparación por pares y 325 000 etiquetas de evaluación. Los resultados experimentales demuestran que el aprendizaje en aspectos específicos permite la generalización a aspectos no vistos, y que el aprendizaje conjunto en múltiples tareas y aspectos produce resultados mutuamente beneficiosos.