Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Critères d'arrêt pour l'itération de valeur sur les jeux simultanés d'accessibilité stochastique et de sécurité

Created by
  • Haebom

Auteur

Marta Grobelna, Jan K\v{r}et insk y, Maximilian Weininger

Contour

Cet article étudie les jeux stochastiques simultanés à somme nulle (JSC) à deux joueurs, avec des objectifs d'accessibilité et de sécurité sur graphes. Si les classes dégénérées telles que les processus de décision de Markov et les jeux stochastiques au tour par tour peuvent être résolues par programmation linéaire ou quadratique, en pratique, l'itération de valeur (IV) surpasse les autres approches et constitue la méthode la plus couramment mise en œuvre. Ces performances pratiques font des IV une alternative intéressante aux solutions théoriques standard utilisant la théorie existentielle des nombres réels pour les JSC. Les IV existants commencent par une approximation de la valeur cible pour chaque état et la mettent à jour de manière itérative, se terminant traditionnellement lorsque deux approximations successives approchent l'approximation ε. Cependant, ces critères de terminaison manquent de garanties quant à la précision de l'approximation. Dans cet article, nous présentons un IV borné (intervalle) pour les JSC, qui compense les séquences de surapproximation convergeant vers l'IV standard et se termine lorsque la surapproximation et la sous-approximation approchent l'approximation ε.

Takeaways, Limitations

Takeaways: Nous présentons un algorithme d'itération de valeur limite pour les CSG, garantissant la précision des approximations. Cela surmonte les limites des algorithmes d'itération de valeur existants et produit des résultats plus fiables.
Limitations: La complexité de calcul et les performances pratiques de l'algorithme d'itération des valeurs limites présenté dans cet article sont insuffisantes. Une évaluation expérimentale sur des CSG de tailles et de complexités diverses est nécessaire. De plus, des recherches supplémentaires pourraient être nécessaires pour déterminer l'efficacité de l'algorithme pour des types spécifiques de CSG.
👍