Bài báo này trình bày thuật toán tập an toàn ngầm định, một thuật toán kiểm soát an toàn không cần mô hình, đảm bảo an toàn cho các tác nhân học tăng cường sâu (DRL). Trong khi các phương pháp DRL hiện tại gặp khó khăn trong việc đảm bảo an toàn, thuật toán của chúng tôi tạo ra các chỉ số an toàn (chứng chỉ rào cản) và các luật kiểm soát an toàn chỉ sử dụng các hàm động hộp đen (ví dụ: mô phỏng song sinh kỹ thuật số). Về mặt lý thuyết, chúng tôi chứng minh sự hội tụ về một tập an toàn trong thời gian hữu hạn và bất biến hướng tới cho cả hệ thống liên tục và hệ thống thời gian rời rạc. Hơn nữa, chúng tôi chứng minh hiệu suất của mình trên chuẩn Safety Gym, đạt được phần thưởng tích lũy 95% ± 9%, vượt trội hơn phương pháp DRL an toàn hiện đại mà không vi phạm an toàn. Hơn nữa, chúng tôi chứng minh khả năng mở rộng sang các hệ thống đa chiều thông qua tính toán song song.