Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Acquisition de commandes sous pression concurrentielle : une approche d'apprentissage par renforcement à adaptation rapide pour les stratégies de subvention des services de VTC

Created by
  • Haebom

Auteur

Fangzhou Shi, Xiaopeng Ke, Xinye Xiong, Kexin Meng, Chang Men, Zhengdan Zhu

Contour

Cet article aborde le problème de l'optimisation des stratégies de coupons des prestataires de services de VTC. Les passagers privilégiant les prestataires proposant des tarifs plus bas, ces derniers sont fortement incités à utiliser des stratégies de coupons pour sécuriser leurs commandes. Par conséquent, cet article propose FCA-RL, un nouveau cadre stratégique de subvention basé sur l'apprentissage par renforcement, qui s'adapte rapidement aux variations de prix des concurrents et optimise le volume de commandes sous contraintes budgétaires. FCA-RL intègre deux techniques clés : l'adaptation rapide à la concurrence (FCA) pour accélérer l'adaptation à la concurrence et l'ajustement lagrangien renforcé (RLA) pour optimiser les décisions en matière de coupons tout en respectant les contraintes budgétaires. De plus, nous présentons RideGym, un environnement de simulation dédié à l'évaluation et à l'analyse comparative de différentes stratégies tarifaires. Les résultats expérimentaux montrent que FCA-RL surpasse les méthodes existantes dans diverses situations de marché.

Takeaways, Limitations_

Takeaways:
Une nouvelle approche pour optimiser les stratégies de coupons pour les fournisseurs de services de covoiturage
S'adapter rapidement aux changements de prix des concurrents tout en respectant les contraintes budgétaires
Fournir un environnement RideGym pour concevoir et évaluer des stratégies de coupons efficaces dans diverses situations de marché
Démontrer l'efficacité d'une stratégie efficace d'optimisation des subventions basée sur l'apprentissage par renforcement
Limitations:
Différences possibles entre l'environnement de simulation RideGym et le monde réel
Risque de survenue de variables inattendues lors de l'application à une plateforme de covoiturage réelle
Des recherches supplémentaires sont nécessaires sur les performances et la stabilité à long terme du FCA-RL
Une analyse plus approfondie est nécessaire sur les différents types de stratégies et de considérations relatives aux coupons.
👍