Bài báo này đề xuất AdaRing, một khuôn khổ tinh chỉnh dựa trên bộ điều hợp để áp dụng hiệu quả các mô hình ngôn ngữ thị giác (VLM) được huấn luyện trước quy mô lớn cho nhiều tác vụ con khác nhau. Các phương pháp tinh chỉnh dựa trên bộ điều hợp hiện có tích hợp bộ điều hợp vào tất cả các lớp để tăng dung lượng bộ điều hợp. Tuy nhiên, chúng bỏ qua sự dư thừa giữa các lớp, hạn chế tỷ lệ nén và hạn chế sức mạnh biểu đạt của các bộ điều hợp đồng nhất. AdaRing đạt được khả năng thích ứng hiệu quả về tham số siêu nhẹ của VLM bằng cách tích hợp và cộng tác nhiều bộ điều hợp dựa trên Phân tích Vòng Tensor (TRD) giữa các lớp. Để loại bỏ sự dư thừa cao giữa các bộ điều hợp giữa các lớp, chúng tôi tận dụng hạng thấp cấp độ tensor để chính thức hóa các bộ điều hợp thành các lõi tensor dùng chung giữa các lớp và các lát cắt cụ thể cho từng lớp. Hơn nữa, sau khi tinh chỉnh nhận biết khái quát hóa, nhiều bộ điều hợp dựa trên lớp khác nhau sẽ cộng tác để xử lý các tác vụ yêu cầu các biểu diễn khác nhau. Kết quả thử nghiệm chứng minh rằng AdaRing đạt được hiệu suất tiên tiến đồng thời giảm 90% yêu cầu tham số huấn luyện trung bình.