본 논문은 원격 감지 및 정보 수집에서 무인 항공기(UAV)의 효율적인 경로 계획에 초점을 맞추고 있다. 다수의 UAV를 협력적으로 배치하면 정보 수집 효율이 크게 향상되지만, 특히 잡음이 많은 환경에서는 협업적인 통신 및 의사결정이 주요 과제로 남아있다. 이를 해결하기 위해, 본 논문은 Counterfactual Multi-Agent Policy Gradients (COMA) 알고리즘 기반의 다중 에이전트 강화 학습(MARL) 프레임워크를 제안한다. 이 프레임워크는 어텐션 메커니즘 기반의 UAV 통신 프로토콜과 훈련-배치 시스템을 통합하여 잡음이 많은 환경에서 통신의 강건성과 개별 의사결정 능력을 크게 향상시킨다. 합성 및 실제 데이터셋에서 수행된 실험 결과, 제안된 방법은 기존 알고리즘보다 경로 계획 효율성 및 강건성이 뛰어나며, 특히 잡음이 많은 환경에서 엔트로피 감소율이 78% 향상되는 것을 보였다.