딥러닝 기반의 강화 학습은 교통 신호 제어 (TSC) 분야에서 성공을 거두었지만, 신경망 정책은 과도한 파라미터화와 투명성 부족으로 인해 해석 가능성과 자원 제약적인 엣지 장치에서의 배포가 어렵다. 본 연구는 MCTS (Monte Carlo Tree Search)를 기반으로 하는 SymLight를 제시하여, 해석 가능하고 배포 가능한 심볼릭 우선순위 함수를 발견하는 프레임워크를 제안한다. SymLight는 교통 상황 특징을 입력으로 받아 각 교통 신호 단계에 대한 우선순위를 출력하며, 이를 통해 단계 전환을 제어한다. 효과적인 탐색을 위해 간결하면서도 표현력이 뛰어난 우선순위 함수 표현과, 기존 고품질 우선순위 함수에서 구조적 패턴을 활용하는 확률적 구조 롤아웃 전략을 제안한다. 실제 데이터셋 실험을 통해 SymLight는 다양한 기준선보다 우수한 성능을 보였으며, 우수한 성능을 유지하면서 해석 가능하고 배포 가능한 TSC 정책을 생성하는 것이 핵심 장점이다.