Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Modélisation cohérente des adversaires statiques dans les jeux à information imparfaite

Created by
  • Haebom

Auteur

Sam Ganzfried

Contour

Dans un environnement multi-agents, l'objectif d'un agent est de maximiser sa récompense totale face à son adversaire. Les solutions issues de la théorie des jeux, comme l'équilibre de Nash, peuvent atteindre des performances robustes dans certains environnements, mais elles ne parviennent pas à exploiter les données historiques et observées obtenues lors d'interactions répétées. Les algorithmes de modélisation antagoniste intègrent des techniques d'apprentissage automatique pour exploiter les données disponibles et exploiter les adversaires non optimaux. Cependant, l'efficacité de ces approches dans les jeux à information incomplète est jusqu'à présent limitée. Cet article montre que les approches de modélisation antagoniste existantes ne satisfont pas à une propriété souhaitable simple, même pour des adversaires statiques issus d'une distribution a priori connue. Autrement dit, elles ne garantissent pas que le modèle se rapproche de la véritable stratégie de l'adversaire lorsque le nombre d'itérations du jeu tend vers l'infini. Dans cet article, nous développons un nouvel algorithme qui atteint cette propriété et résout efficacement un problème de minimisation convexe basé sur une représentation de jeu sous forme de séquence utilisant la descente de gradient projetée. Cet algorithme garantit une convergence efficace vers la véritable stratégie de l'adversaire, en utilisant les observations du jeu et, lorsqu'elles sont disponibles, des données historiques supplémentaires.

Takeaways, Limitations_

Takeaways: Nous présentons un nouvel algorithme qui améliore l'efficacité de la modélisation de l'adversaire dans les jeux à information incomplète. Cet algorithme garantit la convergence vers la stratégie réelle de l'adversaire et résout un problème de minimisation convexe efficace. Il surmonte les limites des algorithmes existants et permet de prédire avec précision les stratégies de l'adversaire à mesure que le nombre d'itérations du jeu augmente.
Limitations: Les performances de l'algorithme dépendent de la représentation du jeu sous forme de séquence, et des recherches supplémentaires sont nécessaires pour déterminer son application à tous les jeux. L'efficacité de l'algorithme peut varier selon la taille et la complexité du jeu. Une vérification expérimentale supplémentaire de ses performances de généralisation dans des environnements de jeu réels est nécessaire.
👍