본 논문은 무인 항공기(UAV) 기반의 탑재형 에이전트(UAV-EA) 평가를 위한 체계적이고 표준화된 벤치마크인 BEDI(Benchmark for Embodied Drone Intelligence)를 제안합니다. 기존 UAV-EA 평가 방법의 한계인 표준화된 벤치마크 부족, 다양한 시험 시나리오 부재, 개방형 시스템 인터페이스의 부족을 해결하기 위해, 지각-결정-행동 루프에 기반한 새로운 동적 연쇄 탑재형 과제 패러다임을 도입하여 복잡한 UAV 과제를 표준화되고 측정 가능한 하위 과제로 분해합니다. 이 패러다임을 기반으로, 의미적 지각, 공간적 지각, 동작 제어, 도구 활용, 과제 계획 등 다섯 가지 핵심 하위 기술을 포함하는 통합 평가 프레임워크를 설계하고, 정적 실제 환경과 동적 가상 시나리오를 통합한 하이브리드 테스트 플랫폼을 구축하여 다양한 환경에서 UAV-EA의 종합적인 성능 평가를 가능하게 합니다. 또한, 개방형 표준 인터페이스를 제공하여 연구자들이 과제를 사용자 지정하고 시나리오를 확장할 수 있도록 하여 유연성과 확장성을 높였습니다. 마지막으로, 최첨단(SOTA) VLM에 대한 실험적 평가를 통해 탑재형 UAV 과제에서의 한계를 밝히고, BEDI 벤치마크가 탑재형 지능 연구 및 모델 최적화에 중요한 역할을 한다는 것을 강조합니다.