Trong bài báo này, chúng tôi đề xuất SHIELD, một phương pháp học tập cộng tác mới để giải quyết lỗ hổng phát hiện âm thanh deepfake. Chúng tôi chứng minh bằng thực nghiệm rằng các phương pháp phát hiện âm thanh deepfake hiện có dễ bị tấn công chống pháp y (AF) dựa trên mạng đối kháng sinh học, và thiết kế một khuôn khổ học tập cộng tác tích hợp mô hình sinh học phòng thủ (DF) để chống lại chúng. SHIELD sử dụng mô hình bộ ba để nắm bắt mối tương quan giữa âm thanh thực và âm thanh tấn công AF, cũng như âm thanh thực và âm thanh tấn công được tạo ra bằng mô hình sinh học phụ trợ. Phương pháp này thể hiện hiệu suất mạnh mẽ trên nhiều mô hình sinh học khác nhau trên các tập dữ liệu ASVspoof2019, In-the-Wild và HalfTruth, đồng thời giảm thiểu hiệu quả sự suy giảm độ chính xác phát hiện do tấn công AF gây ra.