Este artículo propone Symphony, un sistema multiagente distribuido, para abordar los altos costos de implementación, las topologías de comunicación inflexibles y la adaptabilidad limitada de los marcos de agentes centralizados basados en modelos de lenguaje a gran escala (LLM). Symphony permite la coordinación de LLM ligeros en GPU de consumo e introduce tres mecanismos clave: un libro de contabilidad distribuido para registrar características, un protocolo de selección de balizas para la asignación dinámica de tareas y votación ponderada por resultados basada en CoT. Este diseño crea un sistema de coordinación con bajo consumo de recursos, que preserva la privacidad, es escalable y tolerante a fallos. Experimentalmente, Symphony supera las líneas base existentes en los benchmarks de inferencia, demostrando mejoras significativas en la precisión y un rendimiento robusto en una amplia gama de capacidades del modelo.