Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

VectorFit : ajustement adaptatif des vecteurs singuliers et biaisés des modèles de base pré-entraînés

Created by
  • Haebom

Auteur

Suhas G. Hegde, Shilpy Kaur, Aruna Tiwari

Contour

Cet article met en évidence le problème suivant : les méthodes de réglage fin à efficacité paramétrique (PEFT) existantes apprennent de nouveaux poids de faible rang ou épars en parallèle avec les poids pré-entraînés ($W$), mais les apprennent de zéro, ce qui entraîne un écart de performance. Pour résoudre ce problème, nous proposons une nouvelle méthode de paramétrisation, VectorFit. VectorFit exploite efficacement les connaissances existantes inhérentes à $W$ pour apprendre de manière adaptative les vecteurs singuliers et les biais, générant ainsi une matrice de poids incrémentale de haut rang $\Delta W$, similaire à un réglage fin complet. Grâce à des expériences sur 19 tâches de langage et de vision diverses (compréhension et génération de langage naturel, réponses à des questions, classification et génération d'images), nous démontrons que VectorFit offre des performances supérieures à celles des méthodes PEFT existantes avec neuf fois moins de paramètres apprenables.

Takeaways, Limitations

Takeaways:
Nous présentons VectorFit, une nouvelle méthode de paramétrisation qui surmonte les limitations de performances des méthodes PEFT existantes.
Nous améliorons considérablement l’efficacité des paramètres en exploitant les propriétés structurelles et transformationnelles des poids pré-entraînés.
Il surpasse les méthodes existantes dans une variété de tâches linguistiques et visuelles.
Il peut maintenir des performances élevées même dans des environnements aux ressources limitées.
Limitations:
Les résultats expérimentaux présentés dans cet article peuvent être limités à des ensembles de données et des tâches spécifiques. Des expériences plus diversifiées et plus approfondies sont nécessaires.
Des recherches supplémentaires sont nécessaires pour déterminer si les améliorations de performances de VectorFit se généralisent à tous les types de modèles et d’ensembles de données.
Il manque une analyse détaillée de la complexité de calcul et des besoins en mémoire de VectorFit.
👍