Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

LED-Merging: Giảm thiểu xung đột an toàn-tiện ích trong mô hình sáp nhập với vị trí-bầu cử-không giao nhau

Created by
  • Haebom

Tác giả

Qianli Ma, Dongrui Liu, Qian Chen, Linfeng Zhang, Jing Shao

Phác thảo

Bài báo này tập trung vào việc hợp nhất mô hình, một giải pháp không cần học máy, tích hợp nhiều mô hình tác vụ cụ thể để giải quyết vấn đề chi phí tính toán và dữ liệu đáng kể liên quan đến việc tinh chỉnh các mô hình ngôn ngữ quy mô lớn (LLM) đã được huấn luyện trước cho các tác vụ chuyên biệt. Để giải quyết vấn đề đánh đổi giữa an toàn và tiện ích (khi tính tổng quát được tăng cường làm ảnh hưởng đến các biện pháp an toàn) của các phương pháp hợp nhất mô hình hiện có, chúng tôi xác định hai nguyên nhân gốc rễ: nhận dạng sai tế bào thần kinh do lựa chọn dựa trên kích thước tham số đơn giản và sự can thiệp của tế bào thần kinh giữa các tác vụ trong quá trình hợp nhất. Để giải quyết những vấn đề này, chúng tôi đề xuất LED-Merging, một khuôn khổ ba bước xác định các tế bào thần kinh tác vụ cụ thể bằng cách sử dụng các thuộc tính dựa trên gradient, lựa chọn động các tế bào thần kinh quan trọng thông qua hợp nhất tầm quan trọng đa mô hình và tách rời các bản cập nhật xung đột thông qua cô lập tham số. Các thử nghiệm mở rộng trên Llama-3-8B, Mistral-7B và Llama2-13B chứng minh rằng LED-Merging giảm hiệu quả tỷ lệ phản hồi có hại (giảm 31,4% trên HarmBench cho Llama-3-8B-Instruct) trong khi vẫn duy trì hiệu suất sử dụng 95% (độ chính xác 52,39% trên GSM8K). LED-Merging giải quyết vấn đề đánh đổi giữa tính an toàn và tính hữu ích, đồng thời cung cấp một mô hình nhẹ, không cần học để xây dựng các LLM đa tác vụ mạnh mẽ. Mã nguồn có sẵn trên GitHub.

Takeaways, Limitations

Takeaways:
Xác định rõ ràng các vấn đề về an toàn và khả năng sử dụng của các phương pháp hợp nhất mô hình hiện có và đề xuất các giải pháp.
Xây dựng hiệu quả các LLM đa nhiệm mà không cần đào tạo thông qua LED-Merging.
ĐạT được hai mục tiêu cùng lúc: giảm tỷ lệ phản hồi bất lợi và duy trì hiệu suất sử dụng.
Chúng tôi trình bày một kỹ thuật hợp nhất mô hình nhẹ, không cần học để giảm chi phí tính toán.
Limitations:
Cần phải xác minh thêm hiệu suất tổng quát của phương pháp đề xuất.
Cần đánh giá khả năng mở rộng cho nhiều kiến trúc và khối lượng công việc LLM khác nhau.
Có thể có những hạn chế trong việc xác định chính xác tầm quan trọng của một nơ-ron đối với một nhiệm vụ cụ thể.
Vẫn còn chỗ để tối ưu hóa và cải tiến các phương pháp cô lập tham số.
👍