본 논문은 실제 환경에서 강화 학습(RL) 에이전트의 일반화 능력을 향상시키기 위해, 인간의 체계적 일반화 능력을 돕는 추론 행동을 RL 에이전트에 부여하는 연구를 제시한다. 구체적으로, 의사 결정 시 계획 에이전트가 환경 상태의 가장 관련 있는 측면에 동적으로 집중할 수 있게 해주는 상향식 주의 메커니즘인 "공간 추상화"를 도입하여 훈련 환경 밖에서의 일반화를 개선하였다. 또한, 공간 추상화를 기반으로 복잡한 작업을 더 간단한 하위 작업으로 자동 분해하는 Skipper 프레임워크를 개발하여, 분포 변화와 장기적이고 구성적인 계획에 대한 견고성을 확보했다. 마지막으로, 계획 과정에서 생성 모델에 의존하는 에이전트의 일반적인 실패 모드와 안전 위험을 확인하고, 환각적인 목표를 거부할 수 있는 실현 가능성 평가자를 학습시켜 다양한 계획 에이전트의 성능을 향상시켰다.