Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Apprentissage stratégique non linéaire axé sur le bien-être

Created by
  • Haebom

Auteur

Tian Xie, Xueru Zhang

Contour

Cet article étudie la prise de décision algorithmique dans laquelle un comportement individuel stratégique est présent, où les modèles d'apprentissage automatique (AA) prennent des décisions sur le comportement humain et où les individus peuvent modifier stratégiquement leur comportement pour améliorer les données futures. Les recherches antérieures sur l'apprentissage stratégique se sont principalement concentrées sur des contextes linéaires, où les agents dotés de fonctions d'étiquetage linéaires répondent de manière optimale à des politiques de décision linéaires (bruyantes). En revanche, cet article se concentre sur des contextes non linéaires généraux, où les agents répondent à des politiques de décision en se basant uniquement sur des « informations locales » concernant ces politiques. De plus, nous prenons en compte simultanément le bien-être du décideur (précision de la prédiction du modèle), le bien-être social (amélioration de l'agent grâce à son comportement stratégique) et le bien-être de l'agent (mesure dans laquelle l'AA sous-estime l'agent). Tout d'abord, nous généralisons le modèle de réponse optimale de l'agent issu de recherches antérieures aux contextes non linéaires, puis démontrons la compatibilité des objectifs de bien-être. Nous montrons que les trois objectifs de bien-être ne peuvent être simultanément optimaux que dans des conditions limitées, difficiles à atteindre dans des contextes non linéaires. Les résultats théoriques impliquent que les recherches existantes qui maximisent uniquement le bien-être d'un sous-ensemble de parties diminuent inévitablement le bien-être des autres parties. Par conséquent, nous défendons la nécessité d'équilibrer le bien-être de chaque partie dans un contexte non linéaire et proposons un algorithme d'optimisation indéterminé adapté à l'apprentissage stratégique général. Nous vérifions l'efficacité de l'algorithme proposé par des expériences sur des données synthétiques et réelles.

Takeaways, Limitations_

Takeaways: Nous présentons une nouvelle approche des problèmes d'apprentissage stratégique dans des contextes non linéaires et proposons un algorithme d'optimisation équilibré qui prend en compte simultanément le bien-être des décideurs, de la société et des agents. Nous surmontons les limites de la recherche existante et fournissons un cadre complet qui prend en compte le bien-être des différentes parties prenantes. Nous vérifions la faisabilité de l'algorithme par des expériences utilisant des données réelles.
Limitations: Les performances de l'algorithme proposé peuvent être affectées par les caractéristiques des données. Les problèmes d'optimisation dans des environnements non linéaires peuvent être complexes en termes de calcul, et des recherches supplémentaires sont nécessaires pour déterminer l'évolutivité de l'algorithme. La précision de la modélisation du comportement stratégique de l'agent peut avoir un impact significatif sur les performances de l'algorithme. Une généralisation du modèle pour prendre en compte différents types de comportements stratégiques est nécessaire.
👍