Cet article présente une analyse complète des menaces émergentes visant les systèmes d'authentification vocale (VAS) et les contre-mesures anti-usurpation d'identité (CM). Il retrace l'évolution significative de l'authentification vocale, passant des systèmes traditionnels reposant sur des caractéristiques acoustiques personnalisées à des modèles d'apprentissage profond capables d'extraire des données de locuteurs robustes. Il aborde divers types d'attaques, notamment l'empoisonnement des données, les attaques antagonistes, les deepfakes et les attaques par usurpation d'identité. Pour chaque type d'attaque, il résume les méthodologies, met en évidence les ensembles de données couramment utilisés, compare les performances et les limites, et organise la littérature existante à l'aide d'une taxonomie largement acceptée. En mettant en évidence les risques émergents et les défis non résolus, il vise à soutenir le développement de systèmes d'authentification vocale plus sûrs et plus résilients.