본 논문은 강화 학습(RL) 에이전트의 복잡하고 구조화된 작업을 명세하기 위한 선형 시간 논리(LTL)를 활용하는 새로운 접근 방식을 제시한다. 기존 연구가 LTL 지시 사항을 유한 오토마타로 해석하여 일반적인 정책을 학습하는 데 성공했으나, 여러 고수준 이벤트가 동시에 발생하여 복잡하게 상호 작용하는 환경에서는 한계가 있었다. 본 연구는 이러한 단점을 해결하기 위해, 오토마타의 전이에 직접 맞춰진 간단한 부울 공식의 시퀀스에 정책을 조건화하는 새로운 방법을 제안한다. 그래프 신경망(GNN)을 사용하여 구조화된 작업 표현을 생성한다. 복잡한 체스 기반 환경에서의 실험을 통해 제안된 방법의 장점을 입증한다.