Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Polymath : un agent auto-optimisant avec un flux de travail hiérarchique dynamique

Created by
  • Haebom

Auteur

Chia-Tung Ho, Jing Gong, Xufeng Yao, Yunsheng Bai, Abhishek B Akkur, Haoxing Ren

Contour

Pour pallier les limites d'efficacité et d'évolutivité des systèmes d'agents basés sur des modèles de langage à grande échelle (LLM), cet article propose Polymath, un agent de workflow multicouche doté de capacités d'auto-optimisation. Polymath exploite la flexibilité des graphes de workflow et la puissance expressive des workflows basés sur du code pour résoudre divers problèmes concrets. Il améliore les workflows en intégrant l'optimisation de graphes multi-grilles et des algorithmes évolutionnaires basés sur l'auto-réflexion, même sans données étiquetées. Les résultats expérimentaux obtenus sur six jeux de données de référence, incluant le codage, les mathématiques et les questions-réponses à plusieurs tours, montrent que Polymath surpasse les modèles de référence de pointe de 8,1 % en moyenne.

Takeaways, Limitations

Takeaways:
Nous présentons un agent auto-optimisé capable de résoudre des problèmes du monde réel sans données étiquetées.
Combinez les avantages des graphiques de workflow et des workflows basés sur du code pour une plus grande flexibilité et expressivité.
Optimisation efficace du flux de travail à l'aide d'une optimisation graphique basée sur plusieurs grilles et d'algorithmes évolutifs basés sur l'auto-réflexion.
A démontré des améliorations de performance par rapport aux modèles existants dans des tests de performance dans divers domaines.
Limitations:
Des recherches supplémentaires sont nécessaires pour évaluer les performances de généralisation de la méthode proposée et son applicabilité à divers types de problèmes.
Les expériences ont été menées en utilisant seulement six ensembles de données de référence, nécessitant des expériences plus diversifiées et plus étendues.
Il convient de prendre en compte la complexité et le coût de calcul des algorithmes évolutionnaires basés sur l’autoréflexion.
👍