Cet article propose DynaSwarm, un framework dynamique permettant d'améliorer les systèmes multi-agents (SMA) basés sur des modèles de langage à grande échelle (LLM) afin de surmonter les limitations des SMA existants qui reposent sur des structures de graphes collaboratives statiques et conçues manuellement. DynaSwarm s'appuie sur deux innovations clés : (1) l'optimisation de la structure de graphe via le mécanisme d'apprentissage par renforcement critique des acteurs (A2C), qui améliore la stabilité par rapport aux méthodes d'apprentissage par renforcement (RL) existantes ; et (2) un sélecteur de graphe dynamique qui sélectionne de manière adaptative la structure de graphe optimale pour chaque échantillon d'entrée grâce à un réglage fin LLM efficace en termes de paramètres. Cela permet à DynaSwarm d'acheminer dynamiquement les requêtes via un réseau d'agents spécialisés en exploitant les caractéristiques spécifiques à chaque échantillon, plutôt que de s'appuyer sur une architecture de graphe fixe applicable à tous les échantillons. De plus, nous proposons une méthode de réglage fin d'un moteur de recherche de démonstration afin de maximiser l'efficacité de l'apprentissage en contexte (ICL). Des expériences approfondies sur les réponses aux questions, le raisonnement mathématique et les tâches de codage démontrent que DynaSwarm surpasse systématiquement les modèles de base à agent unique et MAS de pointe sur plusieurs backbones LLM.