An End-to-End Deep Reinforcement Learning Approach for Solving the Traveling Salesman Problem with Drones
Created by
Haebom
Category
Empty
저자
Taihelong Zeng, Yun Lin, Yuhe Shi, Yan Li, Zhiqing Wei, Xuanru Ji
개요
본 논문은 트럭-드론 협업 시스템의 효율적인 운영을 위해 TSP-D(Traveling Salesman Problem with Drones) 문제를 해결하기 위한 계층적 Actor-Critic 딥 강화 학습 프레임워크를 제안합니다. 이 프레임워크는 Transformer 기반 인코더와 효율적인 Minimal Gated Unit 디코더를 사용하며, 특히 k-최근접 이웃 희소 어텐션 메커니즘을 통해 공간적 관계에 집중합니다. 실험 결과는 다양한 규모의 TSP-D 문제에서 기존의 휴리스틱 알고리즘 및 강화 학습 방법보다 경쟁력 있는 성능을 보였으며, 특히 훈련 효율성 측면에서 뛰어난 강점을 보여줍니다.