본 논문은 모방 학습(IL)에서 다양한 행동을 생성하고 제어하는 새로운 방법을 제안합니다. 기존 IL 방법들은 전문가 데이터셋에 기반하여 단일 최적 정책을 학습하는 데 초점을 맞추지만, 본 논문은 다양한 행동 데이터셋을 다루는 데 중점을 둡니다. 기존의 전이 단계 다양성 정책 학습이나 궤적 단계 엔트로피 극대화 방식과 달리, 본 논문은 시간적 일관성(전체 에피소드에 걸친 일관된 행동)과 제어 가능성(특정 행동을 선택적으로 활성화할 수 있는 잠재 공간 구성)이라는 두 가지 핵심 특징을 기반으로 합니다. 다양한 작업과 환경에서 최첨단 방법들과 비교 분석을 수행합니다.