[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Tấn công tạo sinh dựa trên cấu trúc ngữ nghĩa để tăng cường khả năng chuyển giao đối nghịch

Created by
  • Haebom

Tác giả

Jongoh Jeong, Hunmin Yang, Jaeseok Jeong, Kuk-Jin Yoon

Phác thảo

Bài báo này đề cập đến các cuộc tấn công đối kháng tạo sinh, huấn luyện bộ tạo nhiễu động trên mô hình thay thế hộp trắng để áp dụng cho mô hình Big Team hộp sau. Không giống như các cuộc tấn công lặp lại thông thường, các cuộc tấn công đối kháng tạo sinh có hiệu quả thời gian suy luận, khả năng mở rộng và khả năng chuyển giao tuyệt vời, nhưng các nghiên cứu trước đây đã không tận dụng đầy đủ khả năng biểu đạt của các mô hình tạo sinh để bảo toàn và sử dụng thông tin ngữ nghĩa. Trong bài báo này, chúng tôi chỉ ra rằng mặc dù các kích hoạt trung gian của bộ tạo chứa các đặc điểm ngữ nghĩa phong phú như ranh giới đối tượng và hình dạng thô, nhưng chúng không được tận dụng đầy đủ, điều này hạn chế việc căn chỉnh nhiễu động với các vùng liên quan đến đối tượng. Để giải quyết vấn đề này, bài báo này đề xuất một khuôn khổ tấn công nhận thức cấu trúc ngữ nghĩa dựa trên Mean Teacher. Mean Teacher hoạt động như một tham chiếu đặc trưng được làm mịn theo thời gian, giúp tăng cường tính nhất quán ngữ nghĩa giữa các kích hoạt lớp ban đầu của mô hình học sinh và các kích hoạt phong phú về mặt ngữ nghĩa của mô hình Giáo viên thông qua việc chắt lọc đặc trưng. Dựa trên kết quả thực nghiệm, chúng tôi neo việc tạo nhiễu loạn vào các khối trung gian ban đầu quan trọng về mặt ngữ nghĩa trong bộ tạo, từ đó tạo ra các nhiễu loạn đối kháng tiến triển trong các vùng giúp cải thiện đáng kể khả năng chuyển giao đối kháng. Thông qua các thử nghiệm mở rộng trên nhiều mô hình, miền và tác vụ khác nhau, chúng tôi chứng minh được sự cải thiện hiệu suất nhất quán so với các phương pháp tấn công tạo sinh hiện đại, đồng thời đánh giá toàn diện chúng bằng các số liệu hiện có và Tỷ lệ Hiệu chỉnh Tình cờ (ACR) mới được đề xuất.

Takeaways, Limitations

Takeaways:
Một khuôn khổ mới để cải thiện khả năng chuyển giao các cuộc tấn công đối nghịch mang tính sáng tạo
Cải thiện sự liên kết nhiễu loạn với các vùng liên quan đến đối tượng bằng cách tận dụng thông tin ngữ nghĩa
Xác minh tính hiệu quả của một khuôn khổ tấn công nhận thức cấu trúc ngữ nghĩa dựa trên Mean Teacher
Giới thiệu một chỉ số đánh giá mới, ACR
Trình bày kết quả thử nghiệm mở rộng cho nhiều mô hình, miền và nhiệm vụ khác nhau
Limitations:
Tiềm năng tăng chi phí tính toán do sử dụng Mean Teacher
Cần nghiên cứu thêm về khả năng áp dụng chung của chỉ số ACR
Có thể phụ thuộc vào một mô hình sản xuất cụ thể
Cần phải xác minh thêm về khả năng khái quát hóa do những hạn chế trong môi trường thử nghiệm.
👍