Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Convergence de Nash des algorithmes d'apprentissage basés sur la moyenne dans les enchères au premier prix

Created by
  • Haebom

Auteur

Xiaotie Deng, Xinyan Hu, Tao Lin, Weiqiang Zheng

Contour

Français Cet article analyse les propriétés de convergence de la dynamique d'apprentissage dans les enchères répétées au premier prix où les enchérisseurs avec des valeurs fixes utilisent des algorithmes basés sur la moyenne (y compris les algorithmes sans regret tels que Multiplicative Weights Update et Follow the Perturbed Leader). Nous caractérisons entièrement la dynamique d'apprentissage des algorithmes basés sur la moyenne sous deux concepts de convergence : la convergence moyenne temporelle (la fraction de temps pendant laquelle les enchérisseurs jouent un équilibre de Nash converge vers 1) et la convergence de dernière itération (les profils de stratégie mixte des enchérisseurs convergent vers un équilibre de Nash). Le résultat de la convergence dépend du nombre d'enchérisseurs les plus valorisés. S'il y a trois enchérisseurs les plus valorisés ou plus, l'équilibre de Nash est presque certain de converger à la fois dans la moyenne temporelle et dans la dernière itération ; s'il y a deux enchérisseurs les plus valorisés, l'équilibre de Nash converge dans la moyenne temporelle mais pas nécessairement dans la dernière itération ; et s'il y a un soumissionnaire ayant la valeur la plus élevée, l'équilibre de Nash peut ne pas converger ni dans la moyenne temporelle ni dans la dernière itération.

Takeaways, Limitations_

Takeaways: Nous présentons une caractérisation complète des caractéristiques de convergence des algorithmes d'apprentissage basés sur la moyenne dans les enchères répétitives, offrant un potentiel Takeaways pour diverses applications, notamment pour les marchés publicitaires en ligne. En particulier, nous présentons de nouvelles possibilités d'étude de la dynamique d'apprentissage en révélant clairement les différences de résultats de convergence selon le nombre de plus offrants.
Limitations: L'analyse s'est limitée aux algorithmes basés sur la moyenne, limitant ainsi la généralisabilité à d'autres types d'algorithmes d'apprentissage. De plus, l'analyse a supposé des valeurs fixes pour les soumissionnaires, de sorte que les résultats peuvent varier en cas de fluctuations des valeurs. Enfin, le fait que la convergence à l'itération finale ne soit pas garantie lorsqu'il y a deux soumissionnaires les plus offrants nécessite des recherches plus approfondies.
👍