Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Agent SE : Optimisation de trajectoire d'auto-évolution dans le raisonnement multi-étapes avec des agents basés sur LLM

Created by
  • Haebom

Auteur

Jiaye Lin, Yifu Guo, Yuzhen Han, Sen Hu, Ziyi Ni, Licheng Wang, Mingguang Chen, Hongzhang Liu, Ronghao Chen, Yangfan He, Daxin Jiang, Binxing Jiao, Chen Hu, Huacan Wang

Contour

Cet article propose SE-Agent, un cadre d'auto-évolution (SE) qui exploite efficacement les trajectoires d'interaction qui émergent lors de la résolution de problèmes d'un agent basé sur un modèle de langage à grande échelle (LLM) afin d'améliorer ses performances. Pour surmonter les limites des méthodes existantes comme MCTS, qui conduisent à des résultats sous-optimaux en raison des interdépendances et du manque de diversité, SE-Agent optimise itérativement le processus d'inférence grâce à trois opérations : modification, recombinaison et amélioration des trajectoires précédentes. Cela lui permet d'explorer diverses voies de résolution, d'atténuer l'impact des voies inefficaces et d'améliorer les performances. Les résultats expérimentaux obtenus avec SWE-bench Verified démontrent des performances de pointe, atteignant jusqu'à 55 % de gains de performance sur cinq LLM robustes.

Takeaways, Limitations

Takeaways:
Une nouvelle approche pour optimiser le processus de résolution de problèmes des agents basés sur LLM est présentée.
Aborder les problèmes d’interdépendance et de manque de diversité des MCTS existants Limitations.
Amélioration efficace des performances et espace de recherche étendu grâce à la réutilisation du chemin précédent.
Excellentes performances prouvées dans les tâches réelles de résolution de problèmes GitHub.
Développer la recherche et suggérer la convivialité grâce à la divulgation de sources ouvertes.
Limitations:
L'efficacité de SE-Agent peut dépendre des performances du LLM utilisé.
ÉTant donné que ces résultats sont basés sur un domaine spécifique (problème GitHub), des recherches supplémentaires sont nécessaires pour déterminer la généralisabilité.
Des recherches supplémentaires sont nécessaires sur les stratégies d’optimisation pour les trois opérations (modification, recombinaison et amélioration).
Il est nécessaire de vérifier l’évolutivité de SE-Agent pour les problèmes de très grande complexité.
👍