본 연구는 도시 교통 혼잡 문제를 해결하기 위해, 다중 에이전트 강화 학습(MARL)을 활용하여 여러 교차로의 신호등을 최적화하는 방안을 제시한다. 시뮬레이션 환경에서 무작위 차량 흐름을 모델링하여 현실적인 교통 상황을 반영하였으며, 각 신호등을 자율적인 에이전트로 설정하여 분산형 MARL 컨트롤러를 구현했다. 평균 대기 시간 및 전체 처리량과 같은 지표를 사용하여 고정 시간 제어 방식과 비교 평가한 결과, MARL 방식이 유의미한 개선을 보였다.