역 제약 학습(ICL)은 안전한(즉, 제약을 만족하는) 데모에서 제약을 추론하는 문제입니다. 이렇게 추론된 제약은 새로운 작업에 대한 안전한 정책을 검색하고 잠재적으로 다른 역학적 환경에서도 사용될 수 있기를 기대합니다. 본 논문은 ICL이 어떤 수학적 개체를 복구하는지에 대한 질문을 탐구합니다. 다소 놀랍게도, 이론적 및 실제적으로 ICL은 실패가 이미 발생한 상태 집합이 아니라 실패가 불가피한 상태 집합을 복구한다는 것을 보여줍니다. 안전 제어의 관점에서 이는 실패 집합이 아닌 역방향 도달 가능 튜브(BRT)를 복구한다는 것을 의미합니다. 실패 집합과 달리 BRT는 데이터 수집 시스템의 역학에 따라 달라집니다. 복구된 제약의 역학 조건화가 정책 검색의 샘플 효율성과 학습된 제약의 전이성에 미치는 영향에 대해 논의합니다.