본 논문은 심층 강화학습(Deep Reinforcement Learning, RL)의 시뮬레이터 학습과 실세계 적용 간의 차이(sim-to-real gap) 문제를 해결하기 위한 다양한 기법들을 체계적으로 정리한 최초의 조사 논문이다. 마르코프 결정 과정(Markov Decision Process, MDP)의 핵심 요소(상태, 행동, 전이, 보상)를 기반으로 심층 강화학습의 sim-to-real 기법들을 분류하고, 기존 방법부터 최신 대규모 언어 모델(foundation models) 기반 기법까지 포괄적으로 다룬다. 또한, 각 도메인별 특징과 sim-to-real 성능 평가 과정, 그리고 접근 가능한 코드나 벤치마크를 제시하며, 향후 연구 방향에 대한 과제와 기회를 제시한다. 마지막으로, 최신 연구 동향을 지속적으로 반영하는 저장소를 유지 관리한다고 밝히고 있다.