본 논문은 교통 신호 제어 정책 학습을 위한 효율적이고 이론적 기반을 갖춘 새로운 교통 상태 표현 방법인 일반화된 위상 압력(G2P) 제어를 제시한다. G2P 제어는 간단한 차선 특징만을 고려하여 어떤 위상을 작동시킬지 결정하며, 대기 이론에 기반하여 다중 동종 차선 도로 네트워크에 대한 압력 제어 이론을 일반화한다. 또한 G2P 제어의 일반화된 위상 상태 특징을 기반으로 새로운 교통 상태 표현을 설계하고, 이를 기반으로 강화 학습(RL) 기반 알고리즘 템플릿인 G2P-XLight와 두 가지 RL 알고리즘인 G2P-MPLight와 G2P-CoLight를 개발한다. 실제 데이터셋을 이용한 실험 결과, G2P 제어는 기존 최첨단 휴리스틱 방법들을 능가하며, G2P-XLight는 기존 최첨단 학습 기반 접근 방식보다 성능이 뛰어남을 보였다.