Cet article aborde le problème de l'optimisation des stratégies de coupons des prestataires de services de VTC. Les passagers privilégiant les prestataires proposant des tarifs plus bas, ces derniers sont fortement incités à utiliser des stratégies de coupons pour sécuriser leurs commandes. Par conséquent, cet article propose FCA-RL, un nouveau cadre stratégique de subvention basé sur l'apprentissage par renforcement, qui s'adapte rapidement aux variations de prix des concurrents et optimise le volume de commandes sous contraintes budgétaires. FCA-RL intègre deux techniques clés : l'adaptation rapide à la concurrence (FCA) pour accélérer l'adaptation à la concurrence et l'ajustement lagrangien renforcé (RLA) pour optimiser les décisions en matière de coupons tout en respectant les contraintes budgétaires. De plus, nous présentons RideGym, un environnement de simulation dédié à l'évaluation et à l'analyse comparative de différentes stratégies tarifaires. Les résultats expérimentaux montrent que FCA-RL surpasse les méthodes existantes dans diverses situations de marché.