Navigation in a Three-Dimensional Urban Flow using Deep Reinforcement Learning
Created by
Haebom
Category
Empty
저자
Federica Tonti, Ricardo Vinuesa
개요
본 논문은 딥 강화 학습 기반의 최적 UAV 항법 전략을 개발한다. 복잡한 도시 환경을 3차원 시뮬레이션으로 모델링하고, 난류 및 재순환 구역을 고려한다. Flow-aware PPO와 GTrXL 아키텍처를 결합하여 에이전트가 난류 흐름에 대한 풍부한 정보를 얻도록 한다. 개발된 알고리즘은 PPO+LSTM, PPO+GTrXL, 전통적인 항법 알고리즘과 비교하여 성공률(SR)을 높이고 충돌률(CR)을 낮추는 결과를 보였다.