본 논문은 정적이고 수동으로 설계된 협업 그래프 구조에 의존하는 기존의 다중 에이전트 시스템(MAS)의 한계를 극복하기 위해, 대규모 언어 모델(LLM) 기반 MAS를 향상시키는 동적 프레임워크인 DynaSwarm을 제안합니다. DynaSwarm은 두 가지 핵심 혁신, 즉 (1) 기존 강화학습(RL) 방법보다 안정성이 향상된 액터-크리틱 강화학습(A2C) 메커니즘을 통한 그래프 구조 최적화, 그리고 (2) 매개변수 효율적인 LLM 미세조정을 통해 각 입력 샘플에 대해 최적의 그래프 구조를 적응적으로 선택하는 동적 그래프 선택기를 활용합니다. 이를 통해 DynaSwarm은 모든 샘플에 적용되는 고정된 그래프 아키텍처를 사용하는 대신, 샘플 특유의 특징을 활용하여 특수 에이전트 네트워크를 통해 쿼리를 동적으로 라우팅합니다. 또한, 문맥 내 학습(ICL)의 효과를 극대화하기 위해 데모 검색기를 미세 조정하는 방법을 제안합니다. 질문 응답, 수학적 추론, 코딩 작업에 대한 광범위한 실험을 통해 DynaSwarm이 여러 LLM 백본에서 최첨단 단일 에이전트 및 MAS 기준 모델을 꾸준히 능가함을 보여줍니다.