Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Quay theo trình tự nhóm: Tối ưu hóa phép biến đổi quay để lượng tử hóa miễn phí

Created by
  • Haebom

Tác giả

Euntae Choi, Sumin Song, Woosang Lim, Sungjoo Yoo

Phác thảo

Bài báo này đề xuất một phương pháp tạo ma trận quay mới dựa trên lượng tử hóa sau đào tạo (PTQ) để giải quyết các thách thức triển khai của các mô hình ngôn ngữ quy mô lớn (LLM), vốn đòi hỏi các tài nguyên tính toán tốn kém. Để giải quyết tình trạng suy giảm hiệu suất của các phương pháp dựa trên phép quay hiện có ở độ rộng bit rất thấp, chẳng hạn như 2 bit, chúng tôi trình bày một phương pháp mới giúp giảm lỗi lượng tử hóa bằng cách nhóm các thành phần tần số tương tự nhau bằng cách sử dụng phép biến đổi Walsh-Hadamard và căn chỉnh chuỗi. Cụ thể, chúng tôi trình bày kỹ thuật Xoay Căn chỉnh Chuỗi Nhóm (GSR), sử dụng ma trận đường chéo khối với các khối Walsh nhỏ, cô lập hiệu quả ảnh hưởng của các giá trị ngoại lai và đạt được hiệu suất tương đương với các phương pháp tối ưu hóa dựa trên học máy. Chúng tôi xác thực hiệu suất của phương pháp được đề xuất thông qua các tác vụ suy luận và đánh giá điểm số độ phức tạp (PPL) trên tập dữ liệu WikiText-2, chứng minh sự cải thiện hiệu suất của nó so với các kỹ thuật xoay đã học hiện có.

Takeaways, Limitations

Takeaways:
ĐIều này có thể giảm đáng kể chi phí triển khai LLM bằng cách cho phép lượng tử hóa sau đào tạo hiệu quả ngay cả ở độ rộng bit rất thấp, chẳng hạn như 2 bit.
ĐâY là phương pháp không cần đào tạo, không yêu cầu phải học, do đó có thể giảm chi phí tính toán so với các phương pháp tối ưu hóa hiện có.
Nó có thể được áp dụng bổ sung vào các kỹ thuật quay đã học để cải thiện hiệu suất.
Phương pháp tạo ma trận quay mới của chúng tôi sử dụng phép biến đổi Walsh-Hadamard và căn chỉnh chuỗi có khả năng ứng dụng cao vào các vấn đề lượng tử hóa khác.
Limitations:
Hiệu suất của phương pháp đề xuất dựa trên kết quả thử nghiệm trên một tập dữ liệu cụ thể (WikiText-2) và hiệu suất tổng quát hóa cho các tập dữ liệu hoặc nhiệm vụ khác cần được nghiên cứu thêm.
Do bản chất của phép biến đổi Walsh-Hadamard, độ phức tạp tính toán của nó có thể tăng lên khi áp dụng cho các mô hình có nhiều chiều.
Cần có thêm khả năng áp dụng và phân tích hiệu suất cho nhiều kiến trúc LLM khác nhau.
👍