Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Giải quyết những tác động tàn phá của việc đầu độc dữ liệu đơn nhiệm trong học tập liên tục không có mẫu

Created by
  • Haebom

Tác giả

Stanis{\l}aw Pawlak (Đại học Công nghệ Warsaw, Ba Lan), Bart{\l}omiej Twardowski (Viện Nghiên cứu IDEAS, Ba Lan, Trung tâm Thị giác Máy tính, Đại học Autonoma de Barcelona, Tây Ban Nha), Tomasz Trzci nski (Đại học Công nghệ Warsaw, Ba Lan, Viện Nghiên cứu IDEAS, Ba Lan), Joost van de Weijer (Trung tâm Thị giác Máy tính, Đại học Autonoma de Barcelona, Tây Ban Nha)

Phác thảo

Nghiên cứu này đề cập đến vấn đề bảo mật của việc đầu độc dữ liệu, vốn đã bị bỏ qua trong Học liên tục (CL). Trong khi các nghiên cứu trước đây tập trung vào các cuộc tấn công phụ thuộc vào kịch bản, nghiên cứu này tập trung vào mối đe dọa đơn giản và thực tế hơn của việc đầu độc tác vụ đơn lẻ (STP). Trong một cuộc tấn công STP, kẻ tấn công không có quyền truy cập vào mô hình, dữ liệu tác vụ trước đó hoặc dữ liệu tác vụ trong tương lai. Kẻ tấn công chỉ có quyền truy cập vào dữ liệu tác vụ hiện tại trong luồng dữ liệu và chúng tôi chứng minh rằng nó có thể làm giảm hiệu suất của mô hình bằng cách khai thác lỗi ảnh tiêu chuẩn. Các cuộc tấn công STP làm gián đoạn toàn bộ quá trình học liên tục, làm giảm cả hiệu suất của các tác vụ trước đó (tính ổn định) và khả năng thích ứng với các tác vụ mới (tính dẻo). Cuối cùng, chúng tôi đề xuất một khuôn khổ phòng thủ cấp cao cho CL, cùng với phương pháp phát hiện tác vụ bị đầu độc dựa trên vectơ tác vụ.

Takeaways, Limitations

Takeaways:
Chúng tôi tiết lộ mức độ nghiêm trọng của các cuộc tấn công đầu độc nhiệm vụ đơn lẻ (STP) trong quá trình học liên tục.
Trình bày một khuôn khổ phòng thủ hiệu quả chống lại các cuộc tấn công STP và phương pháp phát hiện các hoạt động đầu độc.
Chúng tôi chứng minh rằng các cuộc tấn công đầu độc dữ liệu vẫn có thể xảy ra ngay cả trong điều kiện hạn chế quyền truy cập thông tin.
Limitations:
Cần nghiên cứu thêm để đánh giá hiệu suất tổng quát và khả năng áp dụng của khuôn khổ phòng thủ được đề xuất vào môi trường thực tế.
Cần phải phân tích các loại tấn công phức tạp và đa dạng hơn.
Cần phải phân tích chi phí tính toán và hiệu suất của các cơ chế phòng thủ chống lại các cuộc tấn công STP.
👍