Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Giám sát độ tin cậy không xâm lấn dựa trên entropy của mạng nơ-ron tích chập

Created by
  • Haebom

Tác giả

Amirhossein Nazeri, Wael Hafez

Phác thảo

Bài báo này trình bày một phương pháp mới để theo dõi entropy của các hoạt động mạng nơ-ron tích chập (CNN) nhằm giải quyết lỗ hổng của chúng trước các cuộc tấn công đối nghịch. Không giống như các phương pháp phát hiện tấn công đối nghịch hiện có đòi hỏi phải đào tạo lại mô hình, sửa đổi kiến ​​trúc mạng hoặc suy giảm hiệu suất trên các đầu vào thông thường, phương pháp của chúng tôi phát hiện các đầu vào đối nghịch bằng cách phát hiện những thay đổi trong entropy kích hoạt mà không cần sửa đổi mô hình. Kết quả thử nghiệm sử dụng VGG-16 cho thấy các đầu vào đối nghịch luôn thay đổi entropy kích hoạt khoảng 7% trong các lớp tích chập ban đầu, đạt độ chính xác phát hiện 90% và giữ tỷ lệ dương tính giả và âm tính giả dưới 20%. Kết quả này chứng minh rằng CNN vốn mã hóa các thay đổi phân phối trong các mẫu kích hoạt của chúng, cho thấy rằng chỉ riêng entropy kích hoạt có thể được sử dụng để đánh giá độ tin cậy của CNN. Do đó, nghiên cứu này cho phép triển khai thực tế các hệ thống thị giác tự chẩn đoán có thể phát hiện các đầu vào đối nghịch theo thời gian thực mà không làm suy giảm mô hình.

Takeaways, Limitations

Takeaways:
Cho phép phát hiện tấn công đối nghịch trên CNN mà không cần sửa đổi mô hình.
Trình bày tính khả thi của việc triển khai hệ thống thị giác tự chẩn đoán để phát hiện đầu vào đối nghịch theo thời gian thực.
Trình bày phương pháp đánh giá độ tin cậy của CNN sử dụng entropy kích hoạt.
ĐạT độ chính xác phát hiện cao (90%) và tỷ lệ lỗi thấp (dưới 20%).
Limitations:
Chỉ có kết quả thử nghiệm cho mô hình VGG-16 được trình bày, do đó cần nghiên cứu thêm để xác định khả năng tổng quát hóa cho các kiến ​​trúc CNN khác.
Cần phải đánh giá thêm hiệu suất phát hiện chống lại nhiều loại tấn công đối nghịch khác nhau.
Cần phải xác nhận thêm về hiệu suất và độ bền trong môi trường thực tế.
👍