본 논문은 자기 지도 학습이 강화 학습의 탐색, 표현 학습, 보상 설계와 같은 핵심 과제들을 해결할 수 있는 잠재력을 가지고 있음을 다룹니다. 최근 연구(METRA)는 상호 정보량 대신 Wasserstein 거리를 최적화하는 것이 성능 향상에 중요하다고 주장했습니다. 본 논문은 METRA에서 관찰된 이점들이 상호 정보량 기술 학습(MISL)의 기존 프레임워크 내에서 설명될 수 있음을 보입니다. 분석을 통해, 더 적은 구성 요소로 METRA의 우수한 성능을 유지하는 새로운 MISL 방법(대조적 후속 특징)을 제시하고, 기술 학습, 대조적 표현 학습, 그리고 후속 특징 간의 연관성을 강조합니다. 마지막으로, 면밀한 ablation study를 통해 본 논문의 방법과 METRA의 핵심 요소들에 대한 통찰력을 제공합니다.