Bài báo này đề xuất TransMiter, một bộ chuyển đổi nhẹ cho việc truyền tải kiến thức thích ứng hiệu quả giữa các mô hình ngôn ngữ thị giác (VLM). TransMiter nắm bắt khoảng cách kiến thức giữa các VLM đã được huấn luyện trước và đã được tinh chỉnh bằng phương pháp học không giám sát, truyền tải kiến thức mà không cần lan truyền ngược. Nó bao gồm một số lượng nhỏ các lớp, có chi phí suy luận tối thiểu, và việc thêm một lượng nhỏ dữ liệu được gắn nhãn giúp cải thiện hiệu suất vượt xa mô hình mạnh mẽ, tinh chỉnh. Kết quả thực nghiệm chứng minh rằng TransMiter truyền tải kiến thức thích ứng hiệu quả trên các VLM với nhiều kích cỡ và kiến trúc khác nhau, đồng thời vẫn duy trì khả năng khái quát hóa.