[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

LoRA Done RITE: Cân bằng biến đổi bất biến mạnh mẽ cho tối ưu hóa LoRA

Created by
  • Haebom

Tác giả

Jui-Nan Yen, Si Si, Zhao Meng, Felix Yu, Sai Surya Duvvuri, Inderjit S. Dhillon, Cho-Jui Hsieh, Sanjiv Kumar

Phác thảo

Trong bài báo này, chúng tôi đề xuất LoRA-RITE để giải quyết vấn đề thiếu bất biến tịnh tiến trong các bộ tối ưu hóa hiện có trong tinh chỉnh hiệu quả tham số cho thích ứng bậc thấp (LoRA). LoRA-RITE là một phương pháp tiền xử lý ma trận thích ứng đạt được bất biến tịnh tiến trong khi vẫn duy trì hiệu suất tính toán. Thông qua phân tích lý thuyết và thử nghiệm trên nhiều mô hình và tác vụ LLM khác nhau như Gemma 2B, 7B và mT5-XXL, chúng tôi chứng minh rằng hiệu suất của nó được cải thiện so với các bộ tối ưu hóa hiện có. Ví dụ, khi thay thế Adam bằng LoRA-RITE trong tinh chỉnh LoRA trên Gemma-2B, chúng tôi đạt được độ chính xác cải thiện 4,6% trong các lệnh Siêu tự nhiên và 3,5% trong bốn chuẩn LLM khác (HellaSwag, ArcChallenge, GSM8K và OpenBookQA).

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một phương pháp mới hiệu quả (LoRA-RITE) để đạt được tính bất biến dịch chuyển trong tối ưu hóa LoRA.
Đã Kiểm chứng hiệu suất cải thiện qua thực nghiệm so với các phương pháp hiện có trên nhiều mô hình và nhiệm vụ LLM khác nhau.
Góp phần cải thiện hiệu quả và hiệu suất của quá trình tinh chỉnh dựa trên LoRA.
Limitations:
Cần nghiên cứu thêm về hiệu suất tổng quát của phương pháp đề xuất.
Cần phải xem xét khả năng áp dụng cho các loại LLM khác hoặc các phương pháp tinh chỉnh.
Cần có một phân tích chi tiết hơn về chi phí tính toán của LoRA-RITE.
👍