# Multi-agent Reinforcement Learning vs. Fixed-Time Control for Traffic Signal Optimization: A Simulation Study

### 저자

Saahil Mahato

### 개요

본 연구는 다중 에이전트 강화 학습(MARL)을 활용하여 시뮬레이션 환경 내 다수 교차로의 신호 제어를 최적화하는 것을 목표로 한다.  Pygame을 이용하여 무작위 차량 흐름을 생성하는 상호 연결된 교차로 네트워크를 시뮬레이션하고, 각 신호등을 자율 에이전트로 설정하여 분산형 MARL 제어기를 구현하였다.  기존의 고정 시간 제어 방식과 비교하여 평균 차량 대기 시간 및 처리량을 측정하여 성능을 평가한 결과, MARL 기반 제어 방식이 통계적으로 유의미한 개선을 보였다.  이는 MARL 기반 동적 제어 전략이 도시 교통 관리 효율성 향상에 큰 가능성을 가지고 있음을 시사한다.

### 시사점, 한계점

- **시사점:**

    - 다중 에이전트 강화학습(MARL)을 이용한 교통 신호 제어가 기존 고정 시간 제어 방식보다 평균 대기 시간 및 처리량을 개선할 수 있음을 보여줌.

    - MARL 기반 동적 교통 신호 제어 전략이 도시 교통 관리 효율성 향상에 유용함을 제시.

- **한계점:**

    - 시뮬레이션 환경에 기반한 연구로, 실제 환경 적용 시 확장성 및 실현 가능성에 대한 추가 연구 필요.

    - 실제 도시 환경의 복잡성을 완벽히 반영하지 못할 가능성 존재.

[PDF 보기](https://arxiv.org/pdf/2505.14544)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).