본 논문은 로봇 공학에서 역동적이고 불확실한 환경(열린 세계)에 대한 빠른 적응 문제를 다룹니다. 기존의 작업 및 동작 계획(TAMP) 방법은 예측할 수 없는 변화에 대처하는 데 어려움을 겪고, 적응 시 데이터 효율이 낮으며, 학습 중 세계 모델을 활용하지 못합니다. 이를 해결하기 위해 저수준 신경망 기반 모델(확률적 전이를 학습하고 내적 호기심 모듈(ICM)을 통해 탐색을 유도)과 고수준 기호 계획 모델(연산자를 사용하여 추상적 전이를 포착하고, 에이전트가 "가상" 공간에서 계획하고 보상 기계를 생성)을 통합한 하이브리드 계획 및 학습 시스템을 제시합니다. 순차적 참신성 주입을 포함하는 로봇 조작 도메인에서의 평가를 통해 제시된 접근 방식이 최첨단 하이브리드 방법보다 빠르게 수렴하고 성능이 뛰어남을 보여줍니다.