SMART-Editor là một khuôn khổ cho bố cục xây dựng và chỉnh sửa nội dung trong cả miền có cấu trúc (áp phích, trang web) và không có cấu trúc (hình ảnh tự nhiên). Không giống như các mô hình hiện có thực hiện chỉnh sửa cục bộ, SMART-Editor duy trì tính nhất quán toàn cục thông qua hai chiến lược: Reward-Refine, một phương pháp tinh chỉnh được hướng dẫn theo phần thưởng tại thời điểm suy luận và RewardDPO, một phương pháp tối ưu hóa sở thích tại thời điểm đào tạo sử dụng các cặp bố cục được căn chỉnh theo phần thưởng. Để đánh giá hiệu suất của mô hình, chúng tôi giới thiệu SMARTEdit-Bench, một chuẩn mực bao gồm các kịch bản chỉnh sửa đa miền, theo tầng. SMART-Editor vượt trội hơn các mô hình cơ sở mạnh như InstructPix2Pix và HIVE, với RewardDPO đạt được mức tăng hiệu suất lên tới 15% trong các thiết lập có cấu trúc và Reward-Refine thể hiện lợi thế của nó trên hình ảnh tự nhiên. Các đánh giá tự động và của con người xác nhận giá trị của các lược đồ dựa trên phần thưởng trong việc tạo ra các chỉnh sửa nhất quán về mặt ngữ nghĩa và căn chỉnh trực quan.