Cet article propose Symphony, un système multi-agents distribué, pour répondre aux coûts de déploiement élevés, aux topologies de communication rigides et à l'adaptabilité limitée des frameworks d'agents centralisés existants basés sur des modèles de langage à grande échelle (LLM). Symphony permet la coordination de LLM légers sur des GPU grand public et introduit trois mécanismes clés : un registre distribué pour l'enregistrement des caractéristiques, un protocole de sélection de balises pour l'allocation dynamique des tâches et un vote pondéré basé sur le CoT. Cette conception crée un système de coordination à faible surcharge, préservant la confidentialité, évolutif et tolérant aux pannes. Expérimentalement, Symphony surpasse les références existantes sur les benchmarks d'inférence, démontrant des gains de précision significatifs et des performances robustes sur une large gamme de capacités de modèle.