Bài báo này trình bày một đánh giá toàn diện về bối cảnh mối đe dọa mới nổi nhắm vào các hệ thống xác thực giọng nói (VAS) và các biện pháp chống giả mạo (CM). Xác thực giọng nói đã có những tiến bộ đáng kể, từ các hệ thống truyền thống dựa trên các đặc điểm âm thanh thủ công đến các mô hình học sâu có khả năng trích xuất các nhúng loa mạnh mẽ. Tuy nhiên, việc áp dụng ngày càng tăng này cũng dẫn đến sự gia tăng các mối đe dọa. Bài báo này theo dõi theo trình tự thời gian sự phát triển của xác thực giọng nói và xem xét cách các lỗ hổng đã phát triển cùng với những tiến bộ công nghệ. Đối với mỗi loại tấn công, chúng tôi tóm tắt các phương pháp luận, làm nổi bật các tập dữ liệu thường được sử dụng, so sánh hiệu suất và các hạn chế, và sắp xếp các tài liệu hiện có bằng cách sử dụng một phân loại được chấp nhận rộng rãi. Bằng cách làm nổi bật các rủi ro mới nổi và những thách thức chưa được giải quyết, chúng tôi mong muốn hỗ trợ sự phát triển của các hệ thống xác thực giọng nói an toàn và linh hoạt hơn. Các loại tấn công được đề cập bao gồm đầu độc dữ liệu, tấn công đối kháng, deepfake và tấn công giả mạo đối kháng.