본 논문은 라그랑주 교통 제어를 위한 새로운 프레임워크인 다중 잔차 전문가 혼합 학습(MRMEL)을 제시합니다. 라그랑주 교통 제어는 자율 주행 차량(AV)을 이용하여 교통 흐름을 제어하는 방식으로, 기존의 고정형 신호등과 같은 제어 방식과 대비됩니다. MRMEL은 다양한 교통 상황에 대한 일반화가 어렵다는 라그랑주 교통 제어의 문제점을 해결하기 위해, 하위 최적의 기본 정책에 학습된 잔차를 추가하는 방식을 사용합니다. 특히, 잔차 강화 학습에서 영감을 얻어, 교통 상황에 따라 가장 적합한 기본 정책을 전문가 혼합 모델로 동적으로 선택하면서 잔차 보정을 학습합니다. 애틀랜타, 달라스 포트워스, 솔트레이크시티의 신호등 교차로에서 실제 데이터 기반 교통 시나리오를 사용한 협력적 친환경 주행 사례 연구를 통해 MRMEL의 유효성을 검증하였으며, 각 설정에서 가장 강력한 기준선 대비 추가적으로 4%-9%의 배기가스 감소 효과를 보였습니다.