본 논문은 상황 계산에 기반하고 비결정적 프로그래밍 구성 요소를 통합한 Golog 언어로 표현된 상위 수준 에이전트 프로그램에 대한 정책 합성을 연구합니다. 완전한 에이전트 제어를 가정하거나 증분 검색에 의존하는 기존의 프로그램 구현 방식과 달리, 환경적 비결정성이 프로그램 결과에 상당한 영향을 미치는 시나리오를 다룹니다. 본 논문의 합성 문제는 주어진 Golog 프로그램을 성공적으로 구현하면서 유한 추적에 대한 선형 시간 논리(LTLf)로 표현된 시간적 명세를 모든 가능한 환경 동작에 걸쳐 만족시키는 정책을 도출하는 것입니다. 표현력이 풍부한 1차 행동 이론 클래스를 활용하여 프로그램 실행을 캡슐화하고 시간적 목표의 만족 여부를 추적하는 유한 게임 아레나를 구성합니다. 게임 이론적 접근 방식을 사용하여 이러한 정책을 도출합니다. 실험 결과는 이 접근 방식이 경계가 없는 객체와 비국지적 효과가 있는 도메인에서 실행 가능함을 보여줍니다. 이 연구는 에이전트 프로그래밍과 시간 논리 합성을 연결하여 비결정적 환경에서 강력한 에이전트 동작을 위한 프레임워크를 제공합니다.