본 논문은 불확실성 하에서 장기적인 의사결정 문제를 해결하기 위해 고전적인 심볼릭 플래너와 트랜스포머 기반 정책을 긴밀하게 결합한 계층적 신경-심볼 제어 프레임워크를 제시합니다. 상위 수준에서는 플래너가 작업 제약 조건과 논리적 일관성을 보장하는 해석 가능한 연산자 시퀀스를 조립하고, 하위 수준에서는 각 연산자가 하위 목표 토큰으로 렌더링되어 의사결정 트랜스포머가 원시 관측값으로부터 직접 미세한 동작을 생성하도록 조건을 줍니다. 이러한 양방향 인터페이스는 심볼릭 추론의 조합적 효율성과 설명 가능성을 유지하면서 심층 시퀀스 모델의 적응성을 희생하지 않으며, 플래닝과 실행 모두에서 근사 오류가 계층 구조 전반에 걸쳐 어떻게 누적되는지 추적하는 원칙적인 분석을 허용합니다. 확률적 그리드 월드 도메인에서의 실험 연구는 제안된 방법이 성공률과 효율성 모두에서 순수 심볼릭, 순수 신경 및 기존 계층적 기준 모델을 일관되게 능가함을 보여주며, 순차적 작업에 대한 강력함을 강조합니다.