본 논문은 학습 기반 제어기의 실세계 적용에 대한 안전성 및 신뢰성 문제를 해결하기 위해, 모델 기반 강화 학습(Model-Based Reinforcement Learning)의 최첨단 세계 모델을 활용하는 방법을 제시합니다. 훈련 단계를 넘어서, 배포된 정책이 충분히 익숙한 상태 공간 영역 내에서만 작동하도록 모니터링하는 방법입니다. 세계 모델의 예측과 관측된 시스템 동작 간의 불일치를 지속적으로 모니터링하여 오류 임계값을 초과하면 비상 정지와 같은 적절한 조치를 취합니다. 이는 작업 특정 지식이 필요하지 않으므로 보편적으로 적용 가능합니다. 로봇 제어 작업에 대한 시뮬레이션 실험과 민첩한 쿼드콥터를 사용한 실제 실험을 통해 이 방법의 효과를 보여주며, 로컬 로봇 기하학 및 전역 중력 크기의 변화, 예상치 못한 힘 감지 등을 확인했습니다. 이를 통해 예측할 수 없는 학습 기반 제어기의 안전하고 신뢰할 수 있는 작동을 새로운 환경에서도 달성할 수 있음을 보여줍니다.