Para abordar las limitaciones de eficiencia y escalabilidad de los sistemas de agentes basados en modelos de lenguaje a gran escala (LLM), este artículo propone Polymath, un agente de flujo de trabajo multicapa con capacidades de autooptimización. Polymath aprovecha la flexibilidad de los grafos de flujo de trabajo y la potencia expresiva de los flujos de trabajo basados en código para resolver diversos problemas del mundo real. Mejora los flujos de trabajo integrando la optimización de grafos basada en múltiples cuadrículas y algoritmos evolutivos basados en autorreflexión, incluso sin datos etiquetados. Los resultados experimentales en seis conjuntos de datos de referencia, que incluyen codificación, matemáticas y preguntas y respuestas multironda, muestran que Polymath supera a los modelos de referencia más avanzados en un promedio del 8,1 %.