본 논문은 강화학습 및 형식적 검증에서 흔히 나타나는 확률적 행동을 가진 시스템을 정확하게 특징짓는 사양을 처리할 수 없는 기존 선형 시간 논리(LTL) 기반의 행동 사양 추론 기술의 한계를 지적한다. 이에 따라, 양성 또는 음성으로 분류된 마르코프 체인 집합으로부터 확률적 LTL(PLTL) 공식의 부울 조합을 추론하는 수동 학습 문제를 다룬다. 본 논문에서는 문법 기반 열거, 탐색 휴리스틱, 확률적 모델 검증 및 부울 집합 덮개 절차를 활용하여 간결한 PLTL 사양을 추론하는 새로운 학습 알고리즘을 제안한다. 강화학습 알고리즘에 의해 유도된 정책으로부터 학습하고 확률적 모델의 변형으로부터 학습하는 두 가지 사례 연구를 통해 알고리즘의 효과를 입증하며, 두 경우 모두 정책 또는 모델 변형 간의 시간적 차이를 간결하게 특징짓는 PLTL 사양을 자동적이고 효율적으로 추출한다.