본 논문은 강화 학습(Reinforcement Learning, RL)에서 목표 설정의 자동화 문제를 해결하기 위해 확률적 커리큘럼 학습 알고리즘을 제시한다. 기존의 계층적 또는 커리큘럼 강화 학습 방법들은 복잡한 행동을 단순한 하위 작업으로 분해하여 학습 효율을 높이는데, 이는 인간의 학습 방식과 유사하다. 하지만 목표 생성을 완전히 자동화하는 것은 여전히 어려운 과제이다. 본 논문에서는 연속 제어 및 탐색 작업에서 강화 학습 에이전트를 위한 목표를 제안하는 새로운 확률적 커리큘럼 학습 알고리즘을 제시함으로써 이 문제에 대한 해결책을 제시한다.