Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Vượt ra ngoài việc truy xuất bộ điều hợp: Thành phần bảo toàn hình học tiềm ẩn thông qua phép chiếu tác vụ thưa thớt

Created by
  • Haebom

Tác giả

Pengfei Jin, Peng Shu, Sifan Song, Sekeun Kim, Qing Xiao, Cheng Chen, Tianming Liu, Xiang Li, Quanzheng Li

Phác thảo

Bài báo này trình bày một phương pháp xây dựng bộ điều hợp LoRA từ thư viện mô-đun được đào tạo trước bằng cách sử dụng học chuyển giao hiệu quả tham số. Các phương pháp hiện có dựa trên các phương pháp tìm kiếm heuristic đơn giản hoặc trung bình thống nhất, bỏ qua cấu trúc tiềm ẩn của các mối quan hệ tác vụ trong không gian biểu diễn. Bài báo này đề xuất một khuôn khổ mới cho việc tái sử dụng bộ điều hợp, xây dựng bộ điều hợp như một bài toán tái tạo thưa thớt có nhận thức hình học. Cụ thể, chúng tôi biểu diễn mỗi tác vụ như một vectơ nguyên mẫu tiềm ẩn được lấy từ bộ mã hóa của mô hình cơ sở và xấp xỉ nguyên mẫu tác vụ mục tiêu như một tổ hợp tuyến tính thưa thớt của các nguyên mẫu tham chiếu đã thu được theo mục tiêu tối ưu hóa chính quy ℓ1. Các trọng số kết hợp thu được được sử dụng để kết hợp các bộ điều hợp LoRA tương ứng nhằm tạo ra một bộ điều hợp tổng hợp phù hợp với tác vụ mục tiêu. Công thức này không chỉ bảo toàn cấu trúc hình học cục bộ của đa tạp biểu diễn tác vụ mà còn chọn ra một tập hợp tối thiểu các bộ điều hợp liên quan, thúc đẩy khả năng diễn giải và tái sử dụng hiệu quả. Chúng tôi chứng minh hiệu quả của phương pháp này trong một số lĩnh vực, bao gồm phân đoạn ảnh y tế, tạo báo cáo y tế và tổng hợp ảnh. Kết quả thử nghiệm làm nổi bật lợi ích của việc kết hợp tìm kiếm và tối ưu hóa nhận biết hình học tiềm ẩn để cải thiện khả năng khái quát hóa không cần bắn.

Takeaways, Limitations

Takeaways:
Khắc phục những hạn chế của phương pháp tìm kiếm đơn giản hiện có và phương pháp tái sử dụng bộ điều hợp LoRA dựa trên mức trung bình
Tận dụng thông tin hình học tiềm ẩn để cho phép cấu hình bộ điều hợp chính xác và hiệu quả hơn.
Cải thiện khả năng diễn giải và hiệu quả bằng cách chỉ chọn số lượng bộ điều hợp có liên quan tối thiểu thông qua các kết hợp tuyến tính thưa thớt.
Thể hiện hiệu suất khái quát hóa zero-shot được cải thiện trên nhiều miền khác nhau.
_____T210932____-:
Hiệu quả của phương pháp đề xuất có thể phụ thuộc vào các tập dữ liệu và nhiệm vụ cụ thể.
Chi phí tính toán của quá trình tối ưu hóa chính quy ℓ1 có thể tương đối cao.
Cần có thêm nhiều thí nghiệm trên nhiều nhiệm vụ và lĩnh vực khác nhau.
👍