AttnMod là một kỹ thuật không cần đào tạo, điều chỉnh sự chú ý chéo trong một mô hình khuếch tán được đào tạo trước để tạo ra các phong cách nghệ thuật mới lạ, không cần gợi ý và mang tính sáng tạo. Kỹ thuật này được lấy cảm hứng từ cách các nghệ sĩ diễn giải lại hình ảnh được tạo ra—ví dụ: làm nổi bật các đặc điểm cụ thể, phân tán màu sắc, làm biến dạng hình bóng và chỉ định các yếu tố vô hình. AttnMod mô phỏng ý định này bằng cách thay đổi cách các gợi ý văn bản điều chỉnh hình ảnh thông qua sự chú ý trong quá trình loại bỏ nhiễu. Sự điều chỉnh hướng đích này cho phép nhiều chuyển đổi phong cách mà không cần thay đổi gợi ý hoặc đào tạo lại mô hình, mở rộng sức mạnh biểu cảm của việc tạo văn bản thành hình ảnh.