MedEBench es un referente integral para evaluar la edición de imágenes médicas basada en texto. Consta de 1182 tripletes de indicaciones de imagen derivados clínicamente que abarcan 70 tareas en 13 regiones anatómicas. Proporciona un marco de evaluación clínicamente relevante que aborda la precisión de la edición, la preservación del contexto y la calidad visual, una comparación sistemática de siete modelos de vanguardia y un protocolo de análisis de fallos mediante IoU entre puntos de atención y regiones de interés. Tiene un gran potencial clínico, que incluye la simulación de resultados quirúrgicos, la generación de materiales educativos personalizados y la mejora de la comunicación con el paciente.