본 논문은 심층 강화 학습(DRL) 에이전트의 안전성을 보장하는 모델-자유 안전 제어 알고리즘인 암시적 안전 집합 알고리즘을 제시합니다. 기존 DRL은 안전성 보장이 어려웠으나, 본 논문의 알고리즘은 블랙박스 동적 함수(예: 디지털 트윈 시뮬레이터)만을 이용하여 안전 지수(장벽 인증서)와 안전 제어 법칙을 생성합니다. 연속 및 이산 시간 시스템 모두에 대해 유한 시간 내 안전 집합으로의 수렴 및 전방 불변성을 이론적으로 증명하고, Safety Gym 벤치마크에서 기존 최고 성능의 안전 DRL 방법보다 95% ± 9%의 누적 보상을 얻으면서 안전 위반 없이 성능을 검증합니다. 또한, 병렬 컴퓨팅을 통해 고차원 시스템으로의 확장성도 보입니다.