본 연구는 로봇 및 제어 분야에서 미지의 환경으로의 일반화를 다루는 논문으로, 특히 맥락적 강화 학습에 초점을 맞추어 훈련 환경과 다른 환경(OOD)에서도 작동할 수 있는 에이전트를 개발하는 것을 목표로 한다. 테스트 시 명시적인 맥락 정보를 사용할 수 없는 상황에서 OOD 일반화를 달성하기 위해, 기존의 복잡한 2단계 접근 방식을 간소화하여 SPARC(single-phase adaptation for robust control)라는 새로운 단일 단계 적응 방식을 제안한다. 고품질 레이싱 시뮬레이터인 Gran Turismo 7과 바람의 영향을 받는 MuJoCo 환경에서 SPARC의 성능을 평가한 결과, 신뢰할 수 있고 강력한 OOD 일반화를 달성함을 확인했다.