Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Agent SE : Optimisation de trajectoire d'auto-évolution dans le raisonnement multi-étapes avec des agents basés sur LLM

Created by
  • Haebom

Auteur

Jiaye Lin, Yifu Guo, Yuzhen Han, Sen Hu, Ziyi Ni, Licheng Wang, Mingguang Chen, Daxin Jiang, Binxing Jiao, Chen Hu, Huacan Wang

Contour

Cet article propose SE-Agent, un nouveau cadre d'optimisation du processus de résolution de problèmes (chemins d'interaction) des agents basé sur des modèles de langage à grande échelle (MLH). Nous abordons les problèmes des méthodes existantes, telles que MCTS, qui ignorent les interdépendances entre les chemins d'interaction et la diversité insuffisante de l'espace de recherche, ce qui entraîne une inférence inefficace. SE-Agent optimise itérativement le processus d'inférence grâce à trois opérations : modification, recombinaison et amélioration des chemins existants. Cela lui permet d'explorer divers chemins de solution au-delà des optima locaux et d'atténuer l'impact des chemins inefficaces, améliorant ainsi les performances. Les résultats expérimentaux obtenus avec le jeu de données vérifié SWE-bench démontrent que notre approche atteint des performances de pointe, avec des gains de performance allant jusqu'à 55 % sur cinq LLM robustes.

Takeaways, Limitations_

Takeaways:
Une nouvelle approche pour optimiser le processus de résolution de problèmes des agents basés sur LLM.
Résoudre les problèmes d'ignorance des interdépendances et de manque de diversité de l'espace de recherche dans les méthodes existantes (__T6780_____)
Amélioration efficace des performances et atténuation de l’impact des chemins inefficaces grâce à des opérations de modification, de recombinaison et d’amélioration.
Obtenez des performances de pointe sur SWE-bench Vérifié (jusqu'à 55 % d'amélioration des performances)
Version open source pour une meilleure accessibilité
Limitations:
Les améliorations de performances de SE-Agent peuvent être limitées à un ensemble de données spécifique (SWE-bench Verified).
Des recherches supplémentaires sont nécessaires sur les performances de généralisation à d’autres types de problèmes ou d’environnements.
Des recherches supplémentaires sont nécessaires sur le réglage des paramètres et l’optimisation des trois opérations (modification, recombinaison et amélioration).
👍