Trong bài báo này, chúng tôi đề xuất một kỹ thuật chưng cất dữ liệu sử dụng mô hình sinh để giảm bớt sự phụ thuộc vào các tập dữ liệu lớn. Khác với các phương pháp hiện có tập trung vào tính nhất quán với tập dữ liệu gốc, bài báo này đề xuất một chiến lược lấy mẫu theo tác vụ cụ thể để cải thiện hiệu suất của các tác vụ hạ nguồn cụ thể, chẳng hạn như tác vụ phân loại. Đây là một phương pháp tạo tập dữ liệu bằng cách lấy phân phối mẫu khớp với phân phối độ khó của tập dữ liệu gốc từ nhóm ảnh, và áp dụng phép biến đổi logarit làm bước tiền xử lý để hiệu chỉnh độ lệch phân phối. Thông qua các thử nghiệm mở rộng, chúng tôi xác minh hiệu quả của phương pháp được đề xuất và đề xuất khả năng áp dụng của nó cho các tác vụ hạ nguồn khác. Mã nguồn có sẵn trên GitHub.