본 논문은 순차적 의사결정 과정에서 사용자의 선호도를 추론하는 문제를 다룬다. 사용자의 선호도는 정규 언어(시간적 사건 순서들의 집합)들의 전순서(preorder)로 표현되는 시간적 목표(temporal goals)로 나타낸다. 유한한 쌍대비교 데이터(finite words 간의 pairwise comparisons)가 주어졌을 때, 시간적 목표 집합과 그들 사이의 전순서를 학습하는 것이 목표이다. 선호도 관계는 선호도 결정적 유한 오토마타(Preference Deterministic Finite Automaton, PDFA)로 모델링될 수 있으며, 문제는 PDFA 학습으로 귀결된다. 크기가 k보다 작은 일관된 PDFA가 존재하는지 여부를 결정하는 문제는 NP-Complete임을 보인다. 특징적 표본(characteristic sample)의 성질을 공식화하고, 주어진 특징적 표본으로부터 실제 PDFA와 동등한 최소 PDFA를 학습하는 알고리즘을 개발한다. 로봇 모션 플래닝 문제를 이용하여 방법론을 제시하고 분석한다.