Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Tactical Decision for Multi-UGV Confrontation with a Vision-Language Model-Based Commander

Created by
  • Haebom

저자

Li Wang, Qizhen Wu, Lei Chen

개요

본 논문은 다수의 무인 지상 차량이 대치하는 상황에서 상황 인식으로부터 자율적으로 진화하는 다중 에이전트 전술적 의사결정 문제를 다룬다. 기존의 수작업 기반 규칙 기반 방법은 복잡하고 일시적인 전장 환경에서 취약하며, 현재의 강화 학습 방법은 해석 가능성 부족으로 인해 전략적 의사결정보다는 행동 조작에 중점을 둔다. 본 논문에서는 자율적인 대치 상황에서 지능적인 인식-결정 추론 문제를 해결하기 위해 비전-언어 모델 기반 사령관을 제안한다. 제안된 방법은 장면 이해를 위한 비전-언어 모델과 전략적 추론을 위한 경량 대규모 언어 모델을 통합하여 공유 의미 공간 내에서 강력한 적응성과 해석 가능성을 갖는 통합된 인식과 의사결정을 달성한다. 규칙 기반 검색 및 강화 학습 방법과 달리, 두 모듈의 결합은 인간 사령관의 인지 과정을 반영하는 완전한 체인 프로세스를 구축한다. 시뮬레이션 및 ablation 실험을 통해 제안된 방법이 기준 모델에 비해 80% 이상의 승률을 달성함을 검증한다.

시사점, 한계점

시사점:
비전-언어 모델과 대규모 언어 모델을 결합하여 무인 지상 차량 대치 상황에서 인간 사령관의 인지 과정을 모방한 새로운 접근 방식을 제시한다.
기존 방법의 한계점인 해석 가능성 부족 문제를 해결하고, 강력한 적응성과 해석 가능성을 확보한다.
시뮬레이션 결과를 통해 높은 승률을 달성하여 제안된 방법의 효과를 검증한다.
한계점:
시뮬레이션 환경에서의 성능 검증이므로 실제 전장 환경에서의 성능은 추가적인 검증이 필요하다.
비전-언어 모델과 대규모 언어 모델의 성능에 의존적일 수 있다. 모델의 성능 저하가 전체 시스템의 성능에 영향을 미칠 수 있다.
복잡하고 다양한 전장 상황에 대한 일반화 능력에 대한 추가적인 연구가 필요하다.
👍