Bài báo này nhấn mạnh nhu cầu về một cơ chế phát hiện mạnh mẽ để giảm thiểu rủi ro rò rỉ thông tin và bất ổn xã hội do sự gia tăng theo cấp số nhân của tin nhắn rác trên Internet. Vì mục đích này, chúng tôi đề xuất GCC-Spam, một khuôn khổ phát hiện tin nhắn rác mới, giải quyết hai thách thức chính: chiến lược đối kháng của những kẻ gửi thư rác và việc thiếu dữ liệu được gắn nhãn. GCC-Spam tích hợp các mạng tương đồng ký tự, học tương phản và mạng đối kháng sinh sinh (GAN) để tăng cường khả năng chống lại các cuộc tấn công làm lu mờ ký tự và đạt được độ chính xác cao ngay cả trong điều kiện dữ liệu hạn chế. Kết quả thử nghiệm sử dụng các tập dữ liệu thực tế cho thấy GCC-Spam đạt tỷ lệ phát hiện cao hơn các phương pháp hiện có và đặc biệt hoạt động tốt ngay cả với một lượng nhỏ dữ liệu được gắn nhãn.