본 논문은 교통 신호 제어(TSC) 문제 해결을 위해 온라인 대규모 언어 모델(LLM)을 활용한 새로운 방법론인 \textbf{\method{}}를 제안합니다. \textbf{\method{}}는 LLM을 진화 엔진으로 사용하여 특정 교통 환경에 최적화된 전문적인 휴리스틱 정책을 도출합니다. 이를 위해, 고차원 교통 데이터를 시간-논리적 사실로 변환하는 SSA(Structured State Abstraction) 모듈과, 잘못된 세부 결정이 좋지 않은 결과로 이어지는 과정을 추적하여 비판하는 CAF(Credit Assignment Feedback) 모듈을 도입했습니다. \textbf{\method{}}는 훈련 없이 프롬프트 수준에서 작동하며, 휴리스틱 및 온라인 LLM 액터를 능가하는 가볍고 강력한 정책을 생성합니다.