Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

MPO : Optimiser les agents LLM grâce à l'optimisation des méta-plans

Created by
  • Haebom

Auteur

Weimin Xiong, Yifan Song, Qingxiu Dong, Bingchan Zhao, Feifan Song, Xun Wang, Sujian Li

Contour

Cet article propose un cadre d'optimisation de la méta-planification (MPO) pour améliorer les performances de planification interactive des agents basés sur des modèles de langage à grande échelle (MLH). Contrairement aux méthodes existantes, qui souffrent d'hallucinations de planification et nécessitent un recyclage pour chaque nouvel agent, MPO intègre directement des conseils explicites via la méta-planification afin d'améliorer la capacité de planification de l'agent. Contrairement aux méthodes existantes qui s'appuient sur des connaissances complexes, MPO s'appuie sur des conseils généraux de haut niveau et optimise en continu le méta-plan en fonction des retours d'expérience de l'agent sur l'exécution de sa tâche. Les résultats expérimentaux sur deux tâches représentatives démontrent que MPO surpasse significativement les modèles de référence existants, offrant une solution prête à l'emploi qui améliore l'efficacité de l'exécution des tâches et leur généralisation à de nouveaux scénarios.

Takeaways, Limitations

Takeaways:
Contribution à la résolution du problème d'hallucination de planification des agents basés sur LLM.
Réduction du besoin de recyclage pour les nouveaux agents.
Des directives générales de haut niveau permettent une optimisation efficace de la planification.
Amélioration de l’efficacité d’exécution des tâches et de la capacité de généralisation.
Facile à intégrer dans les systèmes existants grâce à la fonctionnalité plug-and-play.
Limitations:
Il existe également une dépendance à la conception et à la qualité du méta-plan.
La vérification des performances de généralisation est nécessaire pour différents types de tâches.
Des recherches supplémentaires sont nécessaires pour résoudre les problèmes inattendus qui peuvent survenir dans les applications du monde réel.
👍