Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
Cet article souligne les limites des matrices de pondération adaptatives de faible dimension (telles que LoRA et Adapter), principalement utilisées dans le réglage fin à paramètres efficaces (PEFT) du transformateur de vision (ViT), et présente une méthode améliorée. Les méthodes existantes ne peuvent pas refléter l'orthogonalité approximative des paramètres de base pré-appris dans des matrices de faible dimension, ce qui entraîne de faibles performances de généralisation. Dans cet article, nous proposons une stratégie de réglage fin approximativement orthogonal (AOFT) qui construit une matrice de faible dimension en générant des vecteurs orthogonaux approximatifs à partir d'un seul vecteur apprenable. Grâce à cela, nous démontrons expérimentalement qu'elle améliore les performances de généralisation en conférant des propriétés similaires aux paramètres de base pré-appris aux matrices de faible dimension, et permet d'obtenir des performances compétitives dans diverses tâches de classification d'images.
Takeaways, Limitations
•
Takeaways:
◦
Nous montrons que l’application de l’orthogonalité approximative de l’épine dorsale ViT pré-entraînée à des matrices d’adaptation de faible dimension peut améliorer les performances de généralisation.
◦
Nous démontrons que la stratégie AOFT peut améliorer les performances du PEFT et obtenir des résultats compétitifs.
◦
Nous présentons une méthode efficace pour générer des matrices orthogonales approximatives à l'aide d'un seul vecteur apprenable.
•
Limitations:
◦
ÉTant donné que l’efficacité de la stratégie AOFT proposée est limitée aux tâches de classification d’images, sa généralisabilité à d’autres tâches de vision nécessite une étude plus approfondie.
◦
Il existe un manque d’analyse théorique sur l’impact de l’orthogonalité approximative sur l’amélioration des performances de généralisation.
◦
Une analyse comparative plus approfondie avec d’autres méthodes PEFT est nécessaire.