Pour relever les défis de l'évaluation ouverte des résultats de modèles multimodaux à grande échelle, cet article propose UFEval, un évaluateur à granularité fine intégrant de multiples tâches et aspects. UFEval repose sur une taxonomie hiérarchique des aspects englobant 112 aspects à granularité fine répartis sur quatre tâches : génération de langage naturel, compréhension d'images, génération d'images et génération de textes croisés et d'images. Nous avons entraîné UFEval sur FRABench, un jeu de données d'évaluation à granularité fine composé de 64 000 échantillons de comparaison par paires et de 325 000 étiquettes d'évaluation. Les résultats expérimentaux démontrent que l'apprentissage sur des aspects spécifiques permet la généralisation à des aspects non observés, et que l'apprentissage conjoint sur plusieurs tâches et aspects produit des résultats mutuellement bénéfiques.