Bài báo này thảo luận về sự tiến bộ của một mô hình tạo ảnh tiên tiến, cho phép tạo ảnh cá nhân hóa với cả chủ đề (nội dung) và phong cách do người dùng xác định. Các nghiên cứu trước đây đã đạt được tính cá nhân hóa bằng cách hợp nhất các bộ điều hợp hạng thấp (LoRA) bằng các phương pháp dựa trên tối ưu hóa, nhưng phương pháp này tốn kém về mặt tính toán và không phù hợp để sử dụng theo thời gian thực trên các thiết bị hạn chế về tài nguyên như điện thoại thông minh. Để giải quyết vấn đề này, bài báo đề xuất một phương pháp LoRA$.$rar giúp cải thiện chất lượng hình ảnh đồng thời tăng tốc quá trình hợp nhất lên hơn 4.000 lần. Bằng cách tiền huấn luyện một siêu mạng trên các cặp LoRA có phong cách nội dung đa dạng, chúng tôi học được một chiến lược hợp nhất hiệu quả, có thể khái quát hóa thành các cặp phong cách nội dung mới, cho phép cá nhân hóa nhanh chóng và chất lượng cao. Hơn nữa, chúng tôi xác định những hạn chế của các chỉ số đánh giá chất lượng phong cách nội dung hiện có và đề xuất một giao thức mới sử dụng mô hình ngôn ngữ quy mô lớn đa phương thức (MLLM) để đánh giá chính xác hơn. Đánh giá MLLM và con người chứng minh rằng phương pháp của chúng tôi vượt trội hơn phương pháp tiên tiến về cả độ trung thực của nội dung và phong cách.