본 논문은 일반적인 로봇 시스템 구축을 위한 새로운 접근 방식을 제시한다. 기존의 대규모 학습 방식의 한계(다양한 작업 유형, 데이터 접근성, 물리적 하드웨어 배포)를 극복하기 위해, 모듈성을 기반으로 한 대규모 학습 시스템을 제안한다. 계획(planning)을 통해 모듈성과 계층 구조를 학습 시스템에 강제 적용하고, 고전적인 계획을 이용하여 대규모 정책 학습을 위한 감독 신호를 생성한다. 모의실험을 통해 대규모 정책 학습을 수행하고, 모듈형 고/중 레벨 계획, 학습된 지역 제어, 절차적 장면 생성, 대규모 정책 학습을 통합하여 실제 로봇 시스템에 적용, 제로샷 조작 작업을 수행하는 일반적인 로봇 에이전트를 구축한다.