SMART-Editor es un marco para la maquetación constructiva y la edición de contenido tanto en entornos estructurados (pósteres, sitios web) como no estructurados (imágenes naturales). A diferencia de los modelos existentes que realizan edición local, SMART-Editor mantiene la consistencia global mediante dos estrategias: Reward-Refine, un método de refinamiento guiado por recompensas en tiempo de inferencia, y RewardDPO, un enfoque de optimización de preferencias en tiempo de entrenamiento que utiliza pares de maquetación alineados con las recompensas. Para evaluar el rendimiento del modelo, presentamos SMARTEdit-Bench, un punto de referencia que abarca escenarios de edición en cascada multidominio. SMART-Editor supera a modelos de referencia robustos como InstructPix2Pix y HIVE: RewardDPO logra mejoras de rendimiento de hasta un 15 % en entornos estructurados, y Reward-Refine demuestra su ventaja en imágenes naturales. Las evaluaciones automáticas y humanas confirman el valor de los esquemas basados en recompensas para generar ediciones semánticamente consistentes y visualmente alineadas.