[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

VectorFit : ajustement adaptatif des vecteurs singuliers et biaisés des modèles de base pré-entraînés

Created by
  • Haebom

Auteur

Suhas G. Hegde, Shilpy Kaur, Aruna Tiwari

Contour

Cet article souligne le problème des méthodes de paramétrage efficaces (PEFT) existantes, qui limitent leurs performances, car elles gèlent les pondérations pré-appris et apprennent de nouvelles pondérations de rang faible ou clairsemées. L'apprentissage de nouvelles pondérations à partir de zéro entraîne une dégradation des performances. VectorFit propose une nouvelle méthode de paramétrage qui apprend de manière adaptative les vecteurs singuliers et les biais de W en utilisant les informations inhérentes aux pondérations pré-appris W. Grâce à cela, nous obtenons des performances similaires à celles d'un réglage fin complet avec beaucoup moins de paramètres (réduction de 9x) que les méthodes PEFT existantes, et démontrons expérimentalement sa supériorité dans diverses tâches telles que la compréhension et la génération de langage naturel, la réponse aux questions, ainsi que la classification et la génération d'images à travers 19 jeux de données.

Takeaways, Limitations_

Takeaways:
Nous présentons une nouvelle méthode PEFT, VectorFit, qui utilise efficacement les informations des poids pré-appris pour maximiser l'efficacité des paramètres.
Il atteint des performances élevées avec beaucoup moins de paramètres que les méthodes PEFT existantes, démontrant son efficacité même dans des environnements aux ressources informatiques limitées.
Il démontre d’excellentes performances dans une variété de tâches linguistiques et visuelles, suggérant un large potentiel d’application.
Limitations:
Il est difficile de conclure que les 19 ensembles de données présentés dans l'article garantissent pleinement les performances de généralisation de VectorFit. Des expériences supplémentaires sur des ensembles de données plus diversifiés et plus étendus pourraient être nécessaires.
Nous ne pouvons pas exclure que les améliorations de performances de VectorFit soient limitées à certains types de modèles ou de tâches. Des recherches supplémentaires sont nécessaires sur différentes architectures de modèles et tâches.
👍