Bài báo này đề xuất SCIZOR, một khuôn khổ làm sạch dữ liệu dựa trên học tự giám sát, để giải quyết vấn đề chất lượng kém trong các tập dữ liệu quy mô lớn trong học mô phỏng, một phương pháp huấn luyện robot thực hiện các hành vi đa dạng. SCIZOR giải quyết hai nguồn gây ra chất lượng dữ liệu kém: dữ liệu không tối ưu (thiếu tiến trình tác vụ) và các mẫu trùng lặp. Dữ liệu không tối ưu được loại bỏ bằng bộ dự đoán tiến trình tác vụ dựa trên học tự giám sát, và dữ liệu trùng lặp được loại bỏ bằng mô-đun loại bỏ trùng lặp cho biểu diễn trạng thái-hành động chung. Kết quả thực nghiệm chứng minh rằng SCIZOR đạt được các chính sách học mô phỏng hiệu suất cao ngay cả với dữ liệu hạn chế, đạt mức cải thiện hiệu suất trung bình 15,4% trên nhiều chuẩn mực khác nhau.