Cet article analyse la performance d'agents apprenants hétérogènes sur les marchés d'actifs à rendements probabilistes. Nous comparons notamment la concurrence entre apprenants bayésiens et sans regret et nous nous efforçons d'identifier les conditions dans lesquelles chaque approche est plus efficace. Étonnamment, nous constatons qu'un faible regret n'est pas suffisant pour assurer la survie. Des agents dont le regret est aussi faible que $O(\log T)$ peuvent néanmoins disparaître face à des agents bayésiens avec une probabilité a priori finie et une probabilité a priori positive du modèle correct. En revanche, l'apprentissage bayésien est vulnérable, tandis que l'apprentissage sans regret est plus robuste car il nécessite une connaissance moindre de l'environnement. En nous basant sur les forces et les faiblesses des deux approches, nous proposons une stratégie équilibrée qui utilise les mises à jour bayésiennes pour améliorer la robustesse et l'adaptabilité aux changements de distribution, progressant ainsi vers une approche d'apprentissage combinant le meilleur des deux mondes. La méthode est générale, efficace et facile à mettre en œuvre. Enfin, nous établissons formellement la relation entre les concepts de survie et de domination du marché étudiés en économie et le cadre de minimisation des regrets, reliant ainsi ces théories. Plus largement, cet article contribue à la compréhension de la dynamique des agents d’apprentissage hétérogènes et de leur impact sur les marchés.