Agentic UAVs: LLM-Driven Autonomy with Integrated Tool-Calling and Cognitive Reasoning

작성자

Haebom

카테고리

Empty

저자

Anis Koubaa, Khaled Gabr

개요

무인 항공기(UAV)의 자율성을 향상시키기 위해 LLM(Large Language Model) 기반의 에이전트적 접근 방식을 제시하는 연구입니다. Agentic UAVs 프레임워크는 Perception, Reasoning, Action, Integration, Learning의 5개 레이어로 구성되며, YOLOv11 객체 감지, GPT-4 추론, Gemma 3 모델을 활용하여 ROS 2 및 Gazebo 환경에서 프로토타입을 구축했습니다. 시뮬레이션된 수색 및 구조 시나리오에서 기존 시스템 대비 향상된 객체 탐지 성능, 정확한 행동 권고율을 보였습니다.

시사점, 한계점

•

LLM을 활용한 UAV 자율성 향상 프레임워크 제시

•

실시간 지식 접근 및 외부 시스템과의 통합 가능성 제시

•

시뮬레이션 환경에서의 성능 검증

•

구현을 위한 ROS 2 및 Gazebo, YOLOv11, GPT-4, Gemma 3 모델 사용

•

제한된 환경에서의 검증으로, 실제 환경 적용에 대한 추가 연구 필요

•

계산 오버헤드에 대한 추가 분석 필요

•

모델 성능은 사용된 LLM에 따라 달라질 수 있음

PDF 보기

Made with Slashpage