본 논문은 대규모 용량 제한 픽업 및 배달 문제(CPDPTW)를 해결하기 위해 양자 컴퓨팅을 활용하는 연구를 제시합니다. 특히, 현실적인 최종 배송 서비스에서의 여행 시간을 최소화하기 위해 매개변수화된 양자 회로(PQC)를 강화 학습(RL) 프레임워크에 통합한 새로운 방법을 제안합니다. 얽힘과 변분 계층을 포함하는 문제 특화 인코딩 양자 회로를 설계하고, PPO와 QSVT와의 비교 실험을 통해 제안된 방법의 우수성을 규모와 훈련 복잡성 측면에서 보여줍니다. 기존의 고전적 접근 방식으로는 처리하기 어려운 대규모 문제에 대한 효율적인 해결책을 제시합니다.