Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Hợp nhất Delta mô-đun với các ràng buộc trực giao: Một khuôn khổ có khả năng mở rộng cho việc kết hợp mô hình liên tục và có thể đảo ngược

Created by
  • Haebom

Tác giả

Haris Khan, Sadia Asif, Shumaila Asif

Phác thảo

Trong các triển khai học máy thực tế, các mô hình phải được cập nhật, xây dựng và loại bỏ có chọn lọc khi cần thiết. Tuy nhiên, các phương pháp hợp nhất mô hình và học liên tục hiện có thường gặp phải tình trạng can thiệp tác vụ, quên đột ngột hoặc thiếu khả năng đảo ngược. Trong bài báo này, chúng tôi đề xuất Orthogonally Constrained Modular Delta Merging (MDM-OC), một khuôn khổ mới cho phép xây dựng các mô hình tinh chỉnh có khả năng mở rộng, không can thiệp và có thể đảo ngược. Mỗi mô hình tác vụ cụ thể được mã hóa dưới dạng delta từ một cơ sở chung và được chiếu vào một không gian con trực giao để loại bỏ xung đột. Các delta được chiếu này sau đó được hợp nhất thông qua tối ưu hóa dựa trên gradient để tạo thành một mô hình thống nhất duy trì hiệu suất trên tất cả các tác vụ. Phương pháp này hỗ trợ tích hợp liên tục các mô hình mới, tách cấu trúc để tuân thủ các quy định như yêu cầu của GDPR, và tính ổn định của mô hình thông qua hợp nhất trọng số linh hoạt và tái tạo tổng hợp. Các thử nghiệm mở rộng về điểm chuẩn xử lý ngôn ngữ tự nhiên và thị giác cho thấy MDM-OC vượt trội so với các đường cơ sở trước đây về độ chính xác, khả năng chuyển giao và độ trung thực của việc tách biệt trong khi vẫn duy trì hiệu quả về bộ nhớ và khả năng tính toán. Khuôn khổ này cung cấp một giải pháp nguyên tắc cho việc thiết kế các hệ thống AI mô-đun và tuân thủ.

Takeaways, Limitations

Takeaways:
Cung cấp khuôn khổ xây dựng mô hình tinh chỉnh có khả năng mở rộng, không xâm lấn và có thể đảo ngược.
Hỗ trợ tách mô hình cấu trúc để tuân thủ các quy định như GDPR
Cải thiện độ ổn định của mô hình thông qua tích hợp trọng lượng đàn hồi và phát lại tổng hợp.
Vượt trội hơn các phương pháp hiện có trong các nhiệm vụ xử lý ngôn ngữ tự nhiên và thị giác (độ chính xác, đảo ngược, độ trung thực tách biệt)
Bộ nhớ hiệu quả và dễ xử lý tính toán
Limitations:
Bài báo này không đề cập rõ ràng đến Limitations cụ thể. Cần có thêm các thí nghiệm và ứng dụng trên nhiều tập dữ liệu khác nhau để xác minh thêm hiệu suất tổng quát hóa. Nghiên cứu sâu hơn có thể phát hiện ra các vấn đề như sự phụ thuộc vào môi trường phần cứng cụ thể và những hạn chế về khả năng mở rộng.
👍