본 논문은 다중 에이전트 강화 학습(MARL)에서 탐험-활용의 딜레마를 완화하기 위해, 연결 자율 주행 차량(CAV)의 협력적 의사결정을 최적화하는 topology-enhanced MARL (TPE-MARL) 방법을 제안합니다. 동적 교통 흐름에 대한 게임 토폴로지 텐서를 구성하여 고차원 교통 상태 정보를 효과적으로 압축하고 MARL 알고리즘의 탐색 공간을 줄이는 것이 핵심입니다. QMIX 알고리즘을 기반으로 방문 횟수와 에이전트 상호 정보를 통합한 TPE-MARL 프레임워크를 구축하여 다양한 교통 밀도와 CAV 보급률에 걸쳐 광범위한 시뮬레이션을 통해 효과를 검증했습니다. 그 결과, 교통 효율성, 안전성, 의사결정의 부드러움 및 작업 완료 측면에서 우수한 성능을 보였으며, 혼합 자율 주행 및 완전 자율 주행 시나리오 모두에서 인간 운전자와 비교하거나 능가하는 의사결정 합리성을 보여주었습니다.