Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Sur les coûts d'action d'apprentissage à partir des plans d'entrée

Created by
  • Haebom

Auteur

Marianela Morales, Alberto Pozanco, Giuseppe Canonaco, Sriram Gopalakrishnan, Daniel Borrajo, Manuela Veloso

Contour

Cet article se concentre sur l'apprentissage des coûts d'action, plutôt que sur l'apprentissage de la dynamique d'action, dans l'apprentissage de modèles comportementaux. Contrairement aux études précédentes qui se concentraient sur la spécification de plans valides pour les tâches de planification, cet article présente un nouveau problème : l'apprentissage d'un ensemble de coûts d'action garantissant qu'un ensemble de plans d'entrée est optimal dans le modèle de planification résultant. Pour résoudre ce problème, nous proposons $LACFIP^k$, un algorithme qui apprend les coûts d'action à partir de plans d'entrée non étiquetés. Nous démontrons la performance de $LACFIP^k$ par des résultats théoriques et expérimentaux.

Takeaways, Limitations

Takeaways:
Présenter un nouveau problème appelé apprentissage des coûts d’action et suggérer une solution.
Il est possible de prouver qu'il est possible d'apprendre des actions de manière rentable à partir de données non étiquetées en utilisant l'algorithme $LACFIP^k$.
Une nouvelle direction de recherche dans le domaine de l'apprentissage des coûts d'action pour une planification optimale.
Limitations:
Des recherches supplémentaires sont nécessaires sur les performances et la capacité de généralisation de l'algorithme $LACFIP^k$.
La vérification de l’applicabilité est nécessaire pour divers problèmes de planification et modèles comportementaux.
Des recherches supplémentaires sont nécessaires sur l’applicabilité et l’évolutivité aux problèmes du monde réel.
👍