[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Raisonnement agentique : un cadre simplifié pour améliorer le raisonnement LLM avec des outils agentiques

Created by
  • Haebom

Auteur

Junde Wu, Jiayuan Zhu, Yuyuan Liu, Min Xu, Yueming Jin

Contour

Dans cet article, nous présentons un cadre de raisonnement agentique qui améliore la capacité de raisonnement des modèles de langage à grande échelle (LLM) en intégrant des agents utilisant des outils externes. Il résout des problèmes complexes nécessitant des recherches approfondies en exploitant dynamiquement la recherche web, l'exécution de code et la mémoire structurée. L'innovation clé réside dans l'agent Mind-Map, qui stocke le contexte d'inférence et suit les relations logiques afin de maintenir la cohérence lors des processus d'inférence à long terme grâce à une utilisation intensive des outils. De plus, nous développons un mécanisme de recherche hautement performant qui surpasse les approches existantes grâce à une exploration approfondie des agents de recherche web. Notre méthode appliquée à DeepSeek-R1 atteint des performances de pointe (SOTA) parmi les modèles publics et est comparable à celles d'OpenAI Deep Research, un modèle propriétaire leader dans ce domaine. Des études d'ablation approfondies vérifient la sélection optimale des outils agents et confirment l'efficacité des agents de carte mentale et de recherche web. Le code est disponible à l'adresse https://github.com/theworldofagents/Agentic-Reasoning .

Takeaways, Limitations

Takeaways:
Nous présentons Agent Inference, un nouveau cadre visant à améliorer la capacité d'inférence des LLM.
Assurer la cohérence des processus de raisonnement à long terme grâce aux agents de cartes mentales.
Développement d'un mécanisme de recherche Web hautement efficace qui surpasse les méthodes existantes.
Atteint des performances de pointe parmi les modèles publics et atteint des performances comparables à celles d'OpenAI Deep Research.
Sélection optimale des outils de l'agent et vérification de l'efficacité de l'agent.
Limitations:
Des recherches supplémentaires sont nécessaires pour déterminer la généralisabilité de l’approche présentée dans cet article.
D’autres évaluations des performances pour différents types de problèmes sont nécessaires.
Une analyse plus approfondie est nécessaire sur l’évolutivité et l’efficacité du cadre d’inférence des agents.
Notez qu’il s’agit d’une comparaison de performances et non d’une comparaison directe avec le modèle propriétaire, OpenAI Deep Research.
👍