Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Au-delà de la récupération d'adaptateurs : composition préservant la géométrie latente via une projection de tâches clairsemées

Created by
  • Haebom

Auteur

Pengfei Jin, Peng Shu, Sifan Song, Sekeun Kim, Qing Xiao, Cheng Chen, Tianming Liu, Xiang Li, Quanzheng Li

Contour

Cet article présente une méthode de construction d'adaptateurs LoRA à partir d'une bibliothèque de modules pré-entraînés, utilisant un apprentissage par transfert efficace en termes de paramètres. Les approches existantes reposent sur des heuristiques de recherche simples ou un moyennage uniforme, qui négligent la structure latente des relations entre les tâches dans l'espace de représentation. Cet article propose un nouveau cadre pour la réutilisation des adaptateurs, formulant la construction d'adaptateurs comme un problème de reconstruction parcimonieuse tenant compte de la géométrie. Plus précisément, nous représentons chaque tâche comme un vecteur prototype latent dérivé de l'encodeur d'un modèle de base, et approximons le prototype de la tâche cible comme une combinaison linéaire parcimonieuse des prototypes de référence récupérés, sous un objectif d'optimisation régularisé en ℓ1. Les pondérations combinées résultantes sont utilisées pour fusionner les adaptateurs LoRA correspondants afin de générer un adaptateur composite adapté à la tâche cible. Cette formulation préserve non seulement la structure géométrique locale de la variété de représentation des tâches, mais sélectionne également un ensemble minimal d'adaptateurs pertinents, favorisant ainsi l'interprétabilité et une réutilisation efficace. Nous démontrons l'efficacité de cette approche dans plusieurs domaines, notamment la segmentation d'images médicales, la génération de rapports médicaux et la synthèse d'images. Les résultats expérimentaux mettent en évidence les avantages de la combinaison de la recherche et de l'optimisation prenant en compte la géométrie latente pour une généralisation à zéro coup améliorée.

Takeaways, Limitations

Takeaways:
Surmonter les limites des méthodes existantes de recherche simple et de réutilisation des adaptateurs LoRA basées sur la moyenne
Exploitez les informations géométriques latentes pour permettre des configurations d'adaptateur plus précises et plus efficaces.
Interprétabilité et efficacité améliorées en sélectionnant uniquement le nombre minimum d'adaptateurs pertinents grâce à des combinaisons linéaires clairsemées.
Démontrer des performances améliorées de généralisation à zéro coup dans divers domaines.
Limitations:
L’efficacité de la méthode proposée peut dépendre d’ensembles de données et de tâches spécifiques.
Le coût de calcul de l’optimisation de la régularisation ℓ1 peut être relativement élevé.
D’autres expériences sont nécessaires sur un plus large éventail de tâches et de domaines.
👍