본 논문은 최대 근무 시간 제약이 있는 다중 여정 시간 의존 차량 경로 문제(MTTDVRP)를 해결하기 위해 동시 인코더 및 이중 디코더 어텐션 모델(SED2AM)이라는 심층 강화 학습(DRL) 기반 방법을 제시합니다. SED2AM은 정책 네트워크의 인코딩 모듈에 시간적 지역성 유도적 편향을 도입하여 여행 거리 또는 시간의 시간 의존성을 효과적으로 고려합니다. 디코딩 모듈은 차량 선택 디코더와 여정 구성 디코더로 구성되어 있으며, 여정을 차량에 효과적으로 연결하고 차량에 대한 여정을 구성합니다. 함대 상태와 경로 상태라는 두 가지 유형의 상태 표현을 사용하여 최대 근무 시간 제약이 있는 효과적인 경로 구성에 필요한 정보를 제공합니다. 캐나다 주요 도시 두 곳의 실제 데이터 세트를 사용한 실험 결과는 SED2AM이 기존 최첨단 DRL 기반 및 준최적화 기반 기준 모델보다 성능이 우수하며 더 큰 규모의 문제를 해결하는 데 일반화될 수 있음을 보여줍니다.