Bài báo này trình bày một phương pháp thích ứng miền zero-shot để thích ứng một mô hình với một miền đích mà không có dữ liệu ảnh miền đích. Các nghiên cứu hiện tại đã sử dụng không gian nhúng của CLIP và mô tả văn bản để mô phỏng các đặc điểm kiểu đích, nhưng chúng có những hạn chế trong việc nắm bắt các thay đổi phức tạp trong thế giới thực và thời gian thích ứng dài. Trong bài báo này, chúng tôi đề xuất một phương pháp thích ứng miền dựa trên ảnh tổng hợp (SIDA) sử dụng hình ảnh tổng hợp cung cấp thông tin kiểu đa dạng và chi tiết thay vì mô tả văn bản. SIDA tạo ra hình ảnh tổng hợp phản ánh kiểu miền đích thông qua chuyển đổi hình ảnh dựa trên ảnh nguồn và mô hình hóa hiệu quả các thay đổi trong thế giới thực bằng cách sử dụng các mô-đun trộn miền và chuyển kiểu vá. Trộn miền mở rộng biểu diễn trong một miền bằng cách trộn nhiều kiểu khác nhau và chuyển kiểu vá gán các kiểu khác nhau cho từng miếng vá. Kết quả thử nghiệm cho thấy phương pháp của chúng tôi đạt được hiệu suất tiên tiến trong nhiều tình huống thích ứng zero-shot khác nhau và giảm đáng kể thời gian thích ứng, chứng tỏ hiệu quả cao.