Bài báo này trình bày một phương pháp mới để theo dõi entropy của các hoạt động mạng nơ-ron tích chập (CNN) nhằm giải quyết lỗ hổng của chúng trước các cuộc tấn công đối nghịch. Không giống như các phương pháp phát hiện tấn công đối nghịch hiện có đòi hỏi phải đào tạo lại mô hình, sửa đổi kiến trúc mạng hoặc suy giảm hiệu suất trên các đầu vào thông thường, phương pháp của chúng tôi phát hiện các đầu vào đối nghịch bằng cách phát hiện những thay đổi trong entropy kích hoạt mà không cần sửa đổi mô hình. Kết quả thử nghiệm sử dụng VGG-16 cho thấy các đầu vào đối nghịch luôn thay đổi entropy kích hoạt khoảng 7% trong các lớp tích chập ban đầu, đạt độ chính xác phát hiện 90% và giữ tỷ lệ dương tính giả và âm tính giả dưới 20%. Kết quả này chứng minh rằng CNN vốn mã hóa các thay đổi phân phối trong các mẫu kích hoạt của chúng, cho thấy rằng chỉ riêng entropy kích hoạt có thể được sử dụng để đánh giá độ tin cậy của CNN. Do đó, nghiên cứu này cho phép triển khai thực tế các hệ thống thị giác tự chẩn đoán có thể phát hiện các đầu vào đối nghịch theo thời gian thực mà không làm suy giảm mô hình.