[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

UPCORE: Lựa chọn lõi bảo toàn tiện ích cho quá trình bỏ học cân bằng

Created by
  • Haebom

Tác giả

Vaidehi Patil, Elias Stengel-Eskin, Mohit Bansal

Phác thảo

Trong bài báo này, chúng tôi đề xuất một khuôn khổ Lựa chọn Tập lõi Bảo toàn Tiện ích (UPCORE) để giải quyết tình trạng suy giảm hiệu suất xảy ra trong quá trình bỏ học, bao gồm việc xóa hoặc "quên" một số điểm dữ liệu nhất định khỏi mô hình đã được huấn luyện trước, đặc biệt là trong các mô hình ngôn ngữ quy mô lớn (LLM). UPCORE giảm thiểu sự suy giảm hiệu suất mô hình sau khi bỏ học bằng cách loại bỏ các giá trị ngoại lai khỏi tập dữ liệu bị bỏ quên có tương quan với phương sai của các biểu diễn của mô hình. Trong ba phương pháp bỏ học tiêu chuẩn, UPCORE cân bằng hiệu quả các mục tiêu xung đột giữa hiệu quả xóa dữ liệu và bảo toàn hiệu suất mô hình, và chúng tôi chứng minh điều này bằng một thước đo đánh giá mới dựa trên AUC. UPCORE cải thiện hiệu suất bằng cách thúc đẩy chuyển giao tích cực giữa tập lõi và các điểm dữ liệu bị xóa, đồng thời giảm chuyển giao tiêu cực từ các điểm dữ liệu bị xóa sang các điểm dữ liệu khác.

Takeaways, Limitations

Takeaways:
Chúng tôi giới thiệu UPCORE, một khuôn khổ lựa chọn dữ liệu hiệu quả giúp giảm thiểu sự suy giảm hiệu suất của mô hình trong quá trình bỏ học.
Bằng cách tiết lộ mối tương quan giữa sự hỏng hóc của mô hình và phương sai biểu diễn, chúng tôi cung cấp thông tin chi tiết về cách cải thiện các chiến lược bỏ học.
Chúng tôi trình bày một số liệu đánh giá mới dựa trên AUC để đo lường sự cân bằng giữa hiệu quả xóa dữ liệu và duy trì hiệu suất mô hình.
ĐảM bảo tính tổng quát với phương pháp áp dụng cho nhiều phương pháp bỏ học khác nhau.
Limitations:
Hiệu quả của phương pháp đề xuất đã được kiểm chứng bằng thực nghiệm, nhưng cần có thêm các thử nghiệm trên nhiều kiến trúc mô hình và tập dữ liệu khác nhau.
Vì chỉ số đánh giá dựa trên AUC mới được đề xuất trong bài báo này nên cần có thêm xác nhận trong các nghiên cứu khác.
Thiếu phân tích về độ phức tạp và hiệu quả tính toán của UPCORE.
Thiếu cân nhắc đến các vấn đề về khả năng mở rộng có thể phát sinh khi áp dụng vào các chương trình LLM quy mô lớn trong thế giới thực.
👍