MedEBench est un référentiel complet pour l'évaluation de la retouche d'images médicales à partir de textes. Il comprend 1 182 triplets d'images-guides cliniques couvrant 70 tâches réparties sur 13 régions anatomiques. Il fournit un cadre d'évaluation cliniquement pertinent, prenant en compte la précision de la retouche, la préservation du contexte et la qualité visuelle, une comparaison systématique de sept modèles de pointe et un protocole d'analyse des défaillances utilisant l'IoU entre les points d'attention et les régions d'intérêt. Il présente un potentiel clinique important, notamment pour simuler les résultats chirurgicaux, générer des supports pédagogiques personnalisés et améliorer la communication avec les patients.