본 논문은 다수의 무인 항공기(UAV) 군집의 지능형 제어에 초점을 맞추고 있습니다. 기존의 다중 에이전트 강화 학습(MARL) 방식은 수치적 통신의 의미론적 차이와 균질한 역할 구조의 경직성으로 인해 일반화 성능이 저조하고 작업 확장성이 제한적입니다. 반면 최근 등장한 대규모 언어 모델(LLM) 기반 제어 프레임워크는 방대한 사전 지식을 활용하여 강력한 의미론적 추론 능력을 보여주지만, 온라인 학습 부족 및 정적 사전 지식에 대한 과도한 의존으로 효과적인 탐색에 어려움을 겪습니다. 이러한 한계를 해결하기 위해, 본 논문에서는 역할 적응형 LLM 기반 쌍방향 탐색 알고리즘인 RALLY를 제안합니다. RALLY는 구조화된 자연어를 사용하는 LLM 기반 의미론적 의사 결정 프레임워크와 역할 전환 및 개인화된 의사 결정을 위한 동적 역할 이질성 메커니즘, 그리고 LLM 오프라인 사전 지식과 MARL 온라인 정책을 통합하는 RMIX 기반 역할 할당 전략을 통해 다중 UAV 시스템의 협업 탐색 성능을 향상시킵니다. 다중 에이전트 입자 환경(MPE) 및 소프트웨어-인-더-루프(SITL) 플랫폼에서의 실험 결과, RALLY는 기존 방식보다 작업 적용 범위, 수렴 속도, 일반화 성능이 우수함을 보여줍니다.