Bài báo này đề xuất Low-Confidence Gold (LCG), một khung lọc mới giúp cải thiện hiệu quả tinh chỉnh chỉ thị trong các mô hình ngôn ngữ quy mô lớn. LCG xác định các cặp chỉ thị có giá trị bằng cách sử dụng phân cụm dựa trên trọng tâm và lựa chọn dựa trên độ tin cậy. Học bán giám sát sử dụng bộ phân loại nhẹ tạo ra các tập con chất lượng cao trong khi vẫn duy trì tính đa dạng của dữ liệu. Kết quả thực nghiệm cho thấy một mô hình được tinh chỉnh trên 6.000 mẫu được lọc bởi LCG vượt trội hơn các phương pháp hiện có, thể hiện mức tăng hiệu suất đáng kể trên MT-bench và mức tăng hiệu suất nhất quán trên các chỉ số đánh giá toàn diện. Hiệu quả của khung này trong việc cải thiện hiệu suất đồng thời duy trì hiệu suất mô hình cho thấy một hướng đi đầy hứa hẹn cho việc tinh chỉnh chỉ thị hiệu quả.