Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

EvoCurr : programme d'études auto-évolutif avec génération de codes comportementaux pour la prise de décision complexe

Created by
  • Haebom

Auteur

Yang Cheng, Zilai Wang, Weiyu Ma, Wenhui Zhu, Yue Deng, Jian Zhao

Contour

Cet article propose EvoCurr, un cadre d'apprentissage curriculaire auto-évolutif pour la résolution de problèmes complexes. EvoCurr adapte la progression du résolveur en générant une séquence d'instances de problèmes de difficulté croissante. Lorsque le résolveur rencontre une difficulté, celle-ci est réduite, et lorsqu'il la résout avec succès, elle est augmentée, maintenant ainsi un parcours d'apprentissage optimal. Le résolveur, implémenté sous forme de modèle de génération de code générant des scripts d'arbres de décision Python, acquiert progressivement les compétences nécessaires aux tâches décisionnelles complexes. Les résultats expérimentaux démontrent que la méthode proposée améliore significativement les taux de réussite des tâches et l'efficacité des solutions par rapport aux méthodes de résolution directe existantes.

Takeaways, Limitations

Takeaways:
Nous démontrons que l’apprentissage basé sur le programme LLM a un grand potentiel pour améliorer le raisonnement automatisé dans les problèmes complexes du monde réel.
EvoCurr présente une méthode efficace pour améliorer considérablement les performances du LLM dans la résolution de problèmes complexes.
Nous avons confirmé empiriquement que l’apprentissage du programme par un ajustement progressif de la difficulté peut améliorer l’efficacité de l’apprentissage du LLM.
Limitations:
Actuellement, il est spécialisé dans la génération de scripts d'arbre de décision Python et peut être difficile à appliquer à la résolution d'autres types de problèmes.
ÉTant donné que les performances du Curriculum Generation LLM affectent les performances de l’ensemble du système, il est nécessaire d’améliorer les performances du Curriculum Generation LLM.
Des recherches supplémentaires sont nécessaires sur les performances de généralisation pour des problèmes de complexité variable.
👍