Bài báo này trình bày một phương pháp tiếp cận mới, giải quyết hai thách thức chính của các phương pháp hiện có, giúp căn chỉnh trực tiếp các mô hình khuếch tán với sở thích của con người: chi phí tính toán và nhu cầu điều chỉnh mô hình bù trừ ngoại tuyến liên tục. Các phương pháp hiện có yêu cầu tính toán gradient trong quá trình khử nhiễu đa giai đoạn, dẫn đến chi phí tính toán cao. Hơn nữa, chúng có các bước tối ưu hóa hạn chế và yêu cầu điều chỉnh mô hình bù trừ ngoại tuyến liên tục để đạt được hình ảnh chân thực và hiệu ứng ánh sáng chính xác. Để khắc phục những hạn chế của khử nhiễu đa giai đoạn, bài báo này đề xuất một phương pháp Căn chỉnh Trực tiếp (Direct-Align) xác định trước một từ điển nhiễu và nội suy hiệu quả hình ảnh gốc theo các bước thời gian tùy ý. Hơn nữa, chúng tôi giới thiệu Tối ưu hóa Sở thích Tương đối Ngữ nghĩa (SRPO), sử dụng các tín hiệu có điều kiện văn bản làm bù trừ. Phương pháp này điều chỉnh bù trừ trực tuyến dựa trên sự củng cố nhắc nhở tích cực và tiêu cực, giảm sự phụ thuộc vào việc tinh chỉnh bù trừ ngoại tuyến. Bằng cách tinh chỉnh mô hình FLUX với việc khử nhiễu tối ưu và điều chỉnh bù trừ trực tuyến, chúng tôi đạt được sự cải thiện hơn gấp ba lần về độ chân thực và chất lượng thẩm mỹ theo đánh giá của con người.