Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Polymath: Un agente autooptimizador con flujo de trabajo jerárquico dinámico

Created by
  • Haebom

Autor

Chia-Tung Ho, Jing Gong, Xufeng Yao, Yunsheng Bai, Abhishek B Akkur, Haoxing Ren

Describir

Para abordar las limitaciones de eficiencia y escalabilidad de los sistemas de agentes basados en modelos de lenguaje a gran escala (LLM), este artículo propone Polymath, un agente de flujo de trabajo multicapa con capacidades de autooptimización. Polymath aprovecha la flexibilidad de los grafos de flujo de trabajo y la potencia expresiva de los flujos de trabajo basados en código para resolver diversos problemas del mundo real. Mejora los flujos de trabajo integrando la optimización de grafos basada en múltiples cuadrículas y algoritmos evolutivos basados en autorreflexión, incluso sin datos etiquetados. Los resultados experimentales en seis conjuntos de datos de referencia, que incluyen codificación, matemáticas y preguntas y respuestas multironda, muestran que Polymath supera a los modelos de referencia más avanzados en un promedio del 8,1 %.

Takeaways, Limitations

Takeaways:
Presentamos un agente autooptimizante capaz de resolver problemas del mundo real sin datos etiquetados.
Combine los beneficios de los gráficos de flujo de trabajo y los flujos de trabajo basados en código para lograr una mayor flexibilidad y expresividad.
Optimización eficaz del flujo de trabajo mediante optimización de gráficos basada en múltiples cuadrículas y algoritmos evolutivos basados en autorreflexión.
Se demostraron mejoras de rendimiento con respecto a los modelos existentes en puntos de referencia en varios campos.
Limitations:
Se necesita más investigación para evaluar el rendimiento de generalización del método propuesto y su aplicabilidad a varios tipos de problemas.
Los experimentos se realizaron utilizando sólo seis conjuntos de datos de referencia, lo que requirió experimentos más diversos y extensos.
Se debe considerar la complejidad y el costo computacional de los algoritmos evolutivos basados en la autorreflexión.
👍