Bài báo này tập trung vào học tăng cường (RL), đặc biệt là trong bối cảnh việc học các thuật toán học siêu tăng cường từ dữ liệu thay vì phương pháp thiết kế thủ công thông thường đang ngày càng được chú ý như một mô hình để cải thiện hiệu suất của các hệ thống học máy. Các thuật toán học tăng cường thường được bắt nguồn từ học có giám sát hoặc không giám sát chưa tối ưu, nhưng học siêu tăng cường mang đến khả năng giải quyết vấn đề này. Nghiên cứu này so sánh và phân tích thực nghiệm các thuật toán học siêu tăng cường khác nhau, chẳng hạn như thuật toán tiến hóa để tối ưu hóa hàm hộp đen và mô hình ngôn ngữ quy mô lớn (LLM) để gợi ý mã, được áp dụng cho các quy trình học siêu tăng cường khác nhau. Bên cạnh hiệu suất học siêu tăng cường và kiểm thử siêu tăng cường, chúng tôi còn nghiên cứu các yếu tố như khả năng diễn giải, chi phí mẫu và thời gian đào tạo, đồng thời đề xuất một số hướng dẫn để học siêu tăng cường các thuật toán học siêu tăng cường hiệu suất hơn trong tương lai.