本稿では、大容量容量制限ピックアップおよび配信問題(CPDPTW)を解決するために量子コンピューティングを活用する研究を提示します。具体的には、現実的な最終配送サービスでの旅行時間を最小限に抑えるために、パラメータ化された量子回路(PQC)を強化学習(RL)フレームワークに統合する新しい方法を提案します。エンタングルメントと変分層を含む問題に特化した符号化量子回路を設計し、PPOとQSVTとの比較実験を通じて提案された方法の卓越性を規模と訓練の複雑さの観点から示した。従来の古典的なアプローチは、扱いにくい大規模な問題に対する効率的な解決策を提供します。