Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

OBLIVIATE: Máy học bỏ học mạnh mẽ và thiết thực cho các mô hình ngôn ngữ lớn

Created by
  • Haebom

Tác giả

Xiaoyu Xu, Minxin Du, Qingqing Ye, Haibo Hu

Phác thảo

Bài báo này đề xuất OBLIVIATE , một khuôn khổ bỏ học mạnh mẽ, để giải quyết vấn đề của các mô hình ngôn ngữ quy mô lớn (LLM) được đào tạo trên các tập dữ liệu khổng lồ ghi nhớ nội dung nhạy cảm, có bản quyền hoặc nội dung phản cảm. OBLIVIATE tuân theo một quy trình có cấu trúc về trích xuất mã thông báo mục tiêu, xây dựng tập dữ liệu bảo trì và tinh chỉnh bằng cách sử dụng hàm mất mát tùy chỉnh bao gồm ba thành phần: che giấu, chắt lọc kiến ​​thức và kiến ​​thức thế giới. Nó sử dụng bộ điều hợp hạng thấp (LoRA) để duy trì hiệu quả mà không ảnh hưởng đến chất lượng bỏ học. Các thí nghiệm được tiến hành trên nhiều tập dữ liệu khác nhau, bao gồm bộ truyện Harry Potter, WMDP và TOFU, sử dụng các số liệu toàn diện như chất lượng quên, tính hữu ích của mô hình và tính lưu loát, bao gồm cả điểm thu hồi cấp tài liệu mới. OBLIVIATE chứng minh khả năng chống lại các cuộc tấn công suy luận thành viên, tác động tối thiểu đến dữ liệu bảo trì và hiệu suất mạnh mẽ trong nhiều tình huống khác nhau.

Takeaways, Limitations

Takeaways:
Một giải pháp hiệu quả cho vấn đề ghi nhớ thông tin nhạy cảm trong các mô hình ngôn ngữ quy mô lớn.
Khung OBLIVIATE thể hiện tiềm năng giải quyết các vấn đề về bản quyền và nội dung có hại.
Triển khai việc bỏ học hiệu quả bằng LoRA
Các số liệu đánh giá toàn diện bao gồm điểm số bộ nhớ cấp độ tài liệu mới
Xác minh hiệu suất mạnh mẽ thông qua các thử nghiệm sử dụng nhiều tập dữ liệu và số liệu khác nhau.
Limitations:
Có thể thiếu giải thích chi tiết về các chi tiết triển khai LoRA cụ thể và quy trình tối ưu hóa siêu tham số
Cần phải xác minh hiệu suất tổng quát cho nhiều loại thông tin nhạy cảm và nội dung có hại.
Các vấn đề bổ sung có thể phát sinh khi áp dụng vào môi trường dịch vụ thực tế và khả năng xem xét không đầy đủ Limitations
Có thể thiếu phân tích về chi phí tính toán và thời gian khi áp dụng cho các mô hình quy mô lớn
👍