본 연구는 드론 배송 문제를 제어 문제로 공식화하고, 모델 예측 제어(MPC)를 사용하여 해결했습니다. 낮은 차원의 간단한 그리드 환경과 높은 차원의 복잡한 환경에서 두 가지 실험을 수행했습니다. MPC 방법은 세 가지 인기 있는 다중 에이전트 강화 학습(MARL) 방법인 독립 Q-러닝(IQL), 공동 행동 학습(JAL), 그리고 값 분해 네트워크(VDN)와 비교되었습니다. 그 결과, MPC 방법이 문제를 더 빠르게 해결하고, 최소 비용 달성 및 최적 경로 탐색을 위한 최적 드론 수가 더 적게 필요함을 보였습니다.