무선 전력 전송(WPT) 지원 사물 인터넷(IoT) 시스템에서 무인 항공기(UAV)는 제한된 자원과 최적이 아닌 궤적 계획이라는 문제에 직면합니다. 강화 학습 기반 궤적 계획 방식은 대규모 시스템을 최적화할 때 낮은 검색 효율성과 학습 불안정성 문제를 겪습니다. 이러한 문제를 해결하기 위해 본 논문에서는 그래프 변환기를 기반으로 한 주의 기반 UAV 궤적 최적화(AUTO) 프레임워크를 제시합니다. 이 프레임워크는 주의 궤적 최적화 모델(ATOM)과 행위자-비평가 기반 궤적 학습 방법(TENMA)으로 구성됩니다. ATOM에서는 그래프 인코더를 사용하여 모든 IoTD의 자기 주의 특성을 계산하고, 궤적 디코더를 개발하여 UAV의 수와 궤적을 최적화합니다. TENMA는 개선된 행위자-비평가 방법을 사용하여 ATOM을 훈련하는데, 여기서 시스템의 실제 보상을 기준선으로 적용하여 비평가 네트워크의 분산을 줄입니다. 이 방법은 고품질의 대규모 다중 UAV 궤적 계획에 적합합니다. 마지막으로 현장 사례의 하드웨어 실험을 포함한 수많은 실험을 통해 AUTO 프레임워크의 실현 가능성과 효율성을 검증합니다.