강화 학습은 인공 일반 지능(AGI)을 향한 잠재적인 경로로 제시될 정도로 성숙한 기술이다. 이 연구는 최신 강화 학습 프레임워크가 3D 동일-상이 시각 공간 작업과 같은 더 복잡하고 덜 구조화된 문제 영역에서 지능적인 행동을 나타낼 수 있는지 조사한다. PPO, 행동 복제 및 모방 학습과 같은 최첨단 방법의 초기 적용에서 최적의 전략을 직접 학습하는 데 어려움이 있었지만, 커리큘럼 학습의 성공적인 구현을 통해 유망한 길을 제시했다. 실제 인간 실험 결과를 바탕으로 전략적으로 설계된 학습 계획을 통해 효과적인 학습을 달성했다.