본 논문은 다수의 무인 지상 차량이 대치하는 상황에서 상황 인식으로부터 자율적으로 진화하는 다중 에이전트 전술적 의사결정 문제를 다룬다. 기존의 수작업 기반 규칙 기반 방법은 복잡하고 일시적인 전장 환경에서 취약하며, 현재의 강화 학습 방법은 해석 가능성 부족으로 인해 전략적 의사결정보다는 행동 조작에 중점을 둔다. 본 논문에서는 자율적인 대치 상황에서 지능적인 인식-결정 추론 문제를 해결하기 위해 비전-언어 모델 기반 사령관을 제안한다. 제안된 방법은 장면 이해를 위한 비전-언어 모델과 전략적 추론을 위한 경량 대규모 언어 모델을 통합하여 공유 의미 공간 내에서 강력한 적응성과 해석 가능성을 갖는 통합된 인식과 의사결정을 달성한다. 규칙 기반 검색 및 강화 학습 방법과 달리, 두 모듈의 결합은 인간 사령관의 인지 과정을 반영하는 완전한 체인 프로세스를 구축한다. 시뮬레이션 및 ablation 실험을 통해 제안된 방법이 기준 모델에 비해 80% 이상의 승률을 달성함을 검증한다.