Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

EigenLoRAx : Recyclage des adaptateurs pour trouver des sous-espaces principaux pour une adaptation et une inférence économes en ressources

Created by
  • Haebom

Auteur

Prakhar Kaushik, Ankit Vaidya, Shravan Chaudhari, Alan Yuille

Contour

Dans cet article, nous proposons EigenLoRAx, une technique légère de réglage fin permettant de répondre aux problématiques d'équité en matière d'impact environnemental et d'accessibilité lors du réglage fin des modèles à grande échelle. Elle utilise des adaptateurs de bas rang (LoRA) pré-entraînés pour générer un espace de composantes principales aligné sur les connaissances partagées du domaine et s'adapte rapidement aux nouvelles tâches qui en découlent. Dans les environnements à faibles ressources, l'espace est étendu par l'ajout de vecteurs de base orthogonaux. EigenLoRAx n'apprend que des coefficients légers pour les composantes principales sans nécessiter de réglage fin de l'adaptateur dans son intégralité, ce qui réduit considérablement l'utilisation des paramètres et de la mémoire et améliore l'efficacité de l'apprentissage et de l'inférence. Elle démontre des performances robustes dans divers domaines et tâches, et offre une solution évolutive pour les applications en périphérie, la personnalisation et le déploiement équitable de modèles à grande échelle dans des environnements aux ressources limitées.

Takeaways, Limitations

Takeaways:
Permet un réglage fin efficace des paramètres en exploitant le LoRA existant.
Application efficace de modèles à grande échelle possible même dans des environnements aux ressources limitées.
Utile pour créer des applications basées sur la périphérie et des modèles personnalisés.
Contribuer à résoudre les problèmes d’impact environnemental et d’équité en matière d’accessibilité.
Accélérez la formation et l’inférence.
Limitations:
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de la méthode proposée.
Une évaluation de la compatibilité et des performances de différentes tailles et types de LoRA est requise.
Possible biais envers des domaines ou des tâches spécifiques.
Des recherches sur les stratégies d’optimisation pour la sélection des dimensions de l’espace des composants principaux sont nécessaires.
👍