Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

GCC-Spam: Phát hiện thư rác thông qua GAN, Học tương phản và Mạng tương đồng ký tự

Created by
  • Haebom

Tác giả

Zhijie Wang, Zixin Xu, Zhiyuan Pan

Phác thảo

Bài báo này nhấn mạnh nhu cầu về một cơ chế phát hiện mạnh mẽ để giảm thiểu rủi ro rò rỉ thông tin và bất ổn xã hội do sự gia tăng theo cấp số nhân của tin nhắn rác trên Internet. Vì mục đích này, chúng tôi đề xuất GCC-Spam, một khuôn khổ phát hiện tin nhắn rác mới, giải quyết hai thách thức chính: chiến lược đối kháng của những kẻ gửi thư rác và việc thiếu dữ liệu được gắn nhãn. GCC-Spam tích hợp các mạng tương đồng ký tự, học tương phản và mạng đối kháng sinh sinh (GAN) để tăng cường khả năng chống lại các cuộc tấn công làm lu mờ ký tự và đạt được độ chính xác cao ngay cả trong điều kiện dữ liệu hạn chế. Kết quả thử nghiệm sử dụng các tập dữ liệu thực tế cho thấy GCC-Spam đạt tỷ lệ phát hiện cao hơn các phương pháp hiện có và đặc biệt hoạt động tốt ngay cả với một lượng nhỏ dữ liệu được gắn nhãn.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một mô hình phát hiện thư rác có khả năng chống lại các cuộc tấn công làm tối nghĩa văn bản.
Trình bày chiến lược học tập hiệu quả đạt được hiệu suất cao ngay cả trong môi trường dữ liệu hạn chế (sử dụng học tập tương phản và GAN).
Xác thực tính ưu việt của mô hình dựa trên kết quả thử nghiệm sử dụng tập dữ liệu thực tế.
Limitations:
Cần phải xác nhận thêm hiệu suất tổng quát của mô hình đề xuất.
Cần đánh giá thêm hiệu suất phát hiện các loại tin nhắn rác khác nhau.
Cần phân tích các vấn đề về chất lượng dữ liệu được tạo ra có thể phát sinh khi sử dụng GAN.
👍