Bài báo này đề xuất một kỹ thuật chưng cất dữ liệu tự giám sát (DSD) để giải quyết vấn đề chi phí cao liên quan đến khối lượng lớn dữ liệu cần thiết cho việc huấn luyện các mô hình học sâu quy mô lớn. Khác với phương pháp chưng cất dữ liệu có giám sát thông thường, chúng tôi trình bày một phương pháp nén hình ảnh và biểu diễn thu được thông qua học tự giám sát thành một tập dữ liệu được chưng cất. Để đạt được điều này, chúng tôi đề xuất một phương pháp mới để tham số hóa hình ảnh và biểu diễn sử dụng các cơ sở dữ liệu ít chiều, một kỹ thuật tăng cường được xác định trước để giải quyết vấn đề bất ổn định của việc tăng cường dữ liệu, và một mạng nhẹ để nén các cặp chưng cất. Các thí nghiệm trên nhiều tập dữ liệu khác nhau chứng minh tính hiệu quả của phương pháp được đề xuất, hiệu suất tổng quát hóa của nó trên nhiều kiến trúc khác nhau và hiệu suất học chuyển giao vượt trội của nó.