Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

DynaSwarm : Sélection dynamique de structures graphiques pour systèmes multi-agents basés sur LLM

Created by
  • Haebom

Auteur

Hui Yi Leong, Yuqing Wu

Contour

Cet article propose DynaSwarm, un framework dynamique permettant d'améliorer les systèmes multi-agents (SMA) basés sur des modèles de langage à grande échelle (LLM) afin de surmonter les limitations des SMA existants qui reposent sur des structures de graphes collaboratives statiques et conçues manuellement. DynaSwarm s'appuie sur deux innovations clés : (1) l'optimisation de la structure de graphe via le mécanisme d'apprentissage par renforcement critique des acteurs (A2C), qui améliore la stabilité par rapport aux méthodes d'apprentissage par renforcement (RL) existantes ; et (2) un sélecteur de graphe dynamique qui sélectionne de manière adaptative la structure de graphe optimale pour chaque échantillon d'entrée grâce à un réglage fin LLM efficace en termes de paramètres. Cela permet à DynaSwarm d'acheminer dynamiquement les requêtes via un réseau d'agents spécialisés en exploitant les caractéristiques spécifiques à chaque échantillon, plutôt que de s'appuyer sur une architecture de graphe fixe applicable à tous les échantillons. De plus, nous proposons une méthode de réglage fin d'un moteur de recherche de démonstration afin de maximiser l'efficacité de l'apprentissage en contexte (ICL). Des expériences approfondies sur les réponses aux questions, le raisonnement mathématique et les tâches de codage démontrent que DynaSwarm surpasse systématiquement les modèles de base à agent unique et MAS de pointe sur plusieurs backbones LLM.

Takeaways, Limitations

Takeaways:
Nous soulignons l’importance des structures graphiques dynamiques dans les MAS basés sur LLM.
Obtenez des améliorations de performances stables par rapport aux méthodes RL existantes grâce à l'optimisation de la structure graphique basée sur A2C.
Augmentez l'adaptabilité à diverses tâches grâce à la sélection dynamique de graphiques basée sur des exemples de fonctionnalités.
Nous présentons une technique de réglage fin du moteur de recherche de démonstration qui améliore les performances en tirant parti de l'apprentissage en contexte (ICL).
Il surpasse les modèles de pointe dans une variété de tâches (réponses aux questions, raisonnement mathématique et codage).
Limitations:
Cet article n'aborde pas le problème spécifique Limitations. Des analyses et des expériences complémentaires sont nécessaires pour élucider Limitations. Par exemple, une analyse plus détaillée est nécessaire concernant le coût de calcul et la vitesse de convergence de l'algorithme A2C, la complexité de la sélection dynamique de graphes et les performances de généralisation pour des types de problèmes spécifiques.
👍