Cet article propose AdaRing, un framework de réglage fin basé sur des adaptateurs permettant d'appliquer efficacement des modèles de langage de vision (MLV) pré-entraînés à grande échelle à diverses sous-tâches. Les méthodes de réglage fin existantes intègrent des adaptateurs à toutes les couches afin d'augmenter leur capacité. Cependant, elles ignorent la redondance intercouche, ce qui limite les taux de compression et restreint la puissance expressive des adaptateurs homogènes. AdaRing permet une adaptation ultra-légère et efficace des MLL en intégrant et en collaborant plusieurs adaptateurs grâce à la décomposition en anneaux tensoriels intercouche (TRD). Pour éliminer la forte redondance entre les adaptateurs intercouches, nous exploitons le rang bas au niveau tenseur pour formaliser les adaptateurs en cœurs tensoriels partagés par couche et en tranches spécifiques à chaque couche. De plus, grâce à un réglage fin tenant compte de la généralisation, divers adaptateurs basés sur les classes collaborent pour gérer des tâches nécessitant des représentations différentes. Les résultats expérimentaux démontrent qu'AdaRing atteint des performances de pointe tout en réduisant de 90 % les besoins moyens en paramètres de formation.