Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

FIT-Print: Hướng tới xác minh quyền sở hữu mô hình chống khiếu nại sai thông qua dấu vân tay được nhắm mục tiêu

Created by
  • Haebom

Tác giả

Shuo Shao, Haozhe Zhu, Yiming Li, Hongwei Yao, Tianwei Zhang, Zhan Qin

Phác thảo

Bài báo này xác định các lỗ hổng trong kỹ thuật lấy dấu vân tay mô hình nhằm bảo vệ quyền sở hữu trí tuệ của các mô hình nguồn mở và đề xuất một phương pháp mới để giải quyết chúng. Chúng tôi chứng minh rằng các kỹ thuật lấy dấu vân tay hiện có, do phương pháp so sánh không có mục tiêu, dễ bị tấn công khai báo sai, trong đó kẻ tấn công khai báo sai một mô hình là của chúng. Do đó, chúng tôi đề xuất FIT-Print, một mô hình lấy dấu vân tay có mục tiêu, và phát triển hai kỹ thuật lấy dấu vân tay mô hình hộp đen, FIT-ModelDiff và FIT-LIME, sử dụng khoảng cách giữa các đầu ra mô hình và tầm quan trọng của đặc trưng của các mẫu cụ thể. Kết quả thực nghiệm chứng minh rằng phương pháp được đề xuất mạnh mẽ và hiệu quả hơn so với các phương pháp hiện có trong việc chống lại các cuộc tấn công khai báo sai.

Takeaways, Limitations

Takeaways:
Tiết lộ lỗ hổng của các kỹ thuật lấy dấu vân tay mô hình hiện có trước các cuộc tấn công khai báo sai.
Chúng tôi đề xuất một mô hình lấy dấu vân tay có mục tiêu (FIT-Print) và các kỹ thuật lấy dấu vân tay mô hình hộp đen mới (FIT-ModelDiff, FIT-LIME).
Phát triển kỹ thuật lấy dấu vân tay mô hình mạnh mẽ và hiệu quả để chống lại các cuộc tấn công tuyên bố sai sự thật.
Trình bày cách tiếp cận mới về bảo vệ sở hữu trí tuệ trong mô hình nguồn mở.
Limitations:
Hiệu suất của phương pháp đề xuất có thể thay đổi tùy thuộc vào mô hình và tập dữ liệu được sử dụng.
Cần có thêm nghiên cứu về khả năng áp dụng và mở rộng trong môi trường thực tế.
Cần đánh giá thêm khả năng chống lại các loại tấn công khác nhau.
👍