Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Hướng tới tấn công suy luận thành viên hộp đen cho các mô hình khuếch tán

Created by
  • Haebom

Tác giả

Jingwei Li, Jing Dong, Tianxing He, Jingzhao Zhang

Phác thảo

Bài báo này đề xuất một phương pháp tấn công suy luận thành viên (MIA) mới để xác định xem một hình ảnh cụ thể có được đưa vào dữ liệu huấn luyện của mô hình khuếch tán hay không, giải quyết các vấn đề bản quyền trong hình ảnh do AI tạo ra. Để khắc phục hạn chế của các phương pháp MIA hiện có yêu cầu truy cập vào mạng U-net nội bộ của mô hình, chúng tôi đề xuất một phương pháp chỉ sử dụng API chuyển đổi hình ảnh sang hình ảnh để xác định xem dữ liệu huấn luyện có được đưa vào hay không mà không cần truy cập vào cấu trúc bên trong của mô hình. Phương pháp này tận dụng lợi thế là mô hình có thể dễ dàng thu được các dự đoán nhiễu cho dữ liệu huấn luyện. Do đó, phương pháp này tính trung bình các kết quả bằng API nhiều lần và so sánh chúng với hình ảnh gốc. Các thí nghiệm trên kiến trúc DDIM, Stable Diffusion và Diffusion Transformer chứng minh rằng phương pháp của chúng tôi vượt trội hơn các phương pháp hiện có.

Takeaways, Limitations

Takeaways:
Một phương pháp mới để tấn công suy luận thành viên trên dữ liệu đào tạo của các mô hình khuếch tán được trình bày.
Có thể tấn công chỉ bằng API mà không cần truy cập vào cấu trúc bên trong của mô hình.
Có hiệu quả trong nhiều kiến trúc khác nhau như DDIM, Stable Diffusion và Diffusion Transformer.
Hiệu suất tốt hơn so với các phương pháp hiện có
_____T137763____-:
Quyền truy cập API phải được bật. Nếu quyền truy cập API bị hạn chế, các cuộc tấn công sẽ không thể xảy ra.
Có thể phụ thuộc vào đặc điểm cụ thể của từng API. Việc sử dụng các API khác có thể làm giảm hiệu suất.
Tỷ lệ thành công của cuộc tấn công có thể bị ảnh hưởng bởi nhiều yếu tố, chẳng hạn như cấu trúc của mô hình, quy mô dữ liệu đào tạo và đặc điểm của API.
👍