[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Apprentissage de modèles d'action de planification numérique sûrs

Created by
  • Haebom

Auteur

Argaman Mordoch, Shahaf S. Shperberg, Roni Stern, Berndan Juba

Contour

Cet article aborde l'important défi consistant à obtenir un modèle de planification représentant fidèlement la dynamique des problèmes lors de l'application des techniques de planification à des situations réelles. Ceci est particulièrement difficile dans les domaines critiques où l'apprentissage par essais-erreurs est impossible. Par conséquent, le modèle d'action utilisé pour la planification doit être sûr, et le plan généré doit être applicable et atteindre l'objectif. Les études précédentes ont principalement étudié l'apprentissage de modèles d'action sûrs dans des domaines où les états peuvent être suffisamment décrits par des variables booléennes. Dans cet article, nous proposons un algorithme d'apprentissage de modèles d'action numériquement sûrs (N-SAM) qui surmonte ces limitations et peut apprendre des antécédents et des effets numériques sûrs. N-SAM s'exécute en temps linéaire par rapport au nombre d'observations et garantit le retour de modèles d'action sûrs sous certaines conditions. Cependant, afin de maintenir cette garantie de sécurité, un nombre significatif d'exemples de chaque action doit être observé avant d'inclure l'action dans le modèle appris. Pour remédier à cette limitation du N-SAM, cet article propose un algorithme N-SAM* qui garantit que chaque action observée est applicable dans au moins certains états. N-SAM inclut des actions observées une seule fois et ne compromet pas la sécurité. N-SAM s'avère optimal en termes de complexité d'échantillon par rapport à d'autres algorithmes garantissant la sécurité. N-SAM et N-SAM* sont évalués sur un large éventail de benchmarks de programmation numérique et comparés aux algorithmes d'apprentissage de modèles d'actions numériques de pointe. Nous abordons également l'impact de la précision numérique sur le processus d'apprentissage.

Takeaways, Limitations

Takeaways:
Nous présentons un algorithme d'apprentissage de modèle d'action sûr (N-SAM, N-SAM*) qui peut apprendre des conditions préalables et des effets numériques.
N-SAM* peut apprendre des modèles sûrs avec des données limitées tout en préservant la sécurité.
Preuve de l'optimalité de la complexité de l'échantillon de N-SAM*.
ÉValuez les performances des algorithmes grâce à des benchmarks approfondis et analysez l’impact de la précision numérique.
Limitations:
N-SAM nécessite de nombreux exemples pour chaque action afin de garantir la sécurité.
Des recherches supplémentaires sont nécessaires sur l’applicabilité et les performances de généralisation aux problèmes du monde réel.
👍