Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Bỏ học công cụ cho LLM được tăng cường công cụ

Created by
  • Haebom

Tác giả

Jiali Cheng, Hadi Amiri

Phác thảo

Bài báo này trình bày một thách thức mới: "giải mã công cụ", loại bỏ việc học về các công cụ cụ thể khỏi các LLM dựa trên công cụ. Không giống như giải mã thông thường, phương pháp này đòi hỏi phải loại bỏ chính kiến thức, chứ không phải các mẫu riêng lẻ. Phương pháp này đặt ra những thách thức, bao gồm chi phí tối ưu hóa LLM cao và nhu cầu về một thước đo đánh giá có nguyên tắc. Để giải quyết những thách thức này, chúng tôi đề xuất ToolDelete, phương pháp đầu tiên để giải mã công cụ hiệu quả trong các LLM dựa trên công cụ. ToolDelete triển khai ba thuộc tính chính để giải mã công cụ hiệu quả và giới thiệu một mô hình Tấn công Suy luận Thành viên (MIA) mới để đánh giá hiệu quả. Các thử nghiệm mở rộng trên nhiều tập dữ liệu huấn luyện công cụ và các LLM dựa trên công cụ khác nhau chứng minh rằng ToolDelete giải mã hiệu quả các công cụ được chọn ngẫu nhiên, đồng thời bảo toàn kiến thức của LLM về các công cụ còn lại và hiệu suất của nó trong các tác vụ chung.

Takeaways, Limitations

Takeaways:
Chúng tôi định nghĩa một thách thức mới gọi là bỏ công cụ trong LLM dựa trên công cụ và trình bày ToolDelete, một phương pháp hiệu quả cho thách thức này.
ToolDelete đã được chứng minh bằng thực nghiệm là có hiệu quả trong việc xóa bỏ dữ liệu học được từ các công cụ cụ thể do lỗ hổng bảo mật, quy định về quyền riêng tư hoặc công cụ không còn được sử dụng nữa.
Một phương pháp đánh giá mới để đo lường hiệu quả của việc bỏ công cụ được trình bày thông qua mô hình MIA mới.
Limitations:
ĐáNh giá hiệu suất của ToolDelete phụ thuộc vào mô hình MIA được đề xuất và cần được xác minh thông qua các số liệu đánh giá khác.
Mặc dù chúng tôi trình bày kết quả thử nghiệm trên nhiều công cụ và tập dữ liệu khác nhau, nhưng vẫn cần nghiên cứu thêm về hiệu suất tổng quát hóa trong môi trường thực tế.
Cần phân tích thêm để xác định khả năng suy giảm hiệu suất tổng thể của LLM trong quá trình bỏ học công cụ.
👍