Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

SMoLoRA : explorer et défier le double oubli catastrophique dans le réglage continu des instructions visuelles

Created by
  • Haebom

Auteur

Ziqi Wang, Chang Che, Qi Wang, Yangyang Li, Zenglin Shi, Meng Wang

Contour

Dans cet article, nous proposons un cadre d'adaptation séparable à mélange d'instructions de bas rang (SMoLoRA) pour résoudre le problème du double oubli catastrophique dans l'adaptation continue des instructions visuelles (CVIT). Les études existantes sur le CVIT ont négligé le problème de la détérioration des capacités de compréhension visuelle et de suivi des instructions lors de l'application du paradigme traditionnel d'apprentissage continu. Le SMoLoRA prévient le double oubli catastrophique et améliore les performances en permettant une adaptation spécifique au domaine par des chemins distincts via deux modules indépendants pour la compréhension visuelle et l'exécution des instructions. De plus, nous proposons un nouveau benchmark CVIT qui évalue la capacité de généralisation à une plus grande variété d'instructions et de tâches inconnues que les benchmarks existants. Les résultats expérimentaux montrent que le SMoLoRA surpasse les méthodes existantes pour atténuer le double oubli, améliorer les performances de généralisation à des tâches inconnues et garantir la robustesse à diverses instructions.

Takeaways, Limitations

Takeaways:
Nous identifions le problème du double oubli catastrophique qui a été négligé dans le CVIT existant et présentons un nouveau cadre (SMoLoRA) pour le résoudre.
Réaliser un apprentissage adaptatif efficace et prévenir l’oubli grâce à des modules séparés pour la compréhension visuelle et l’exécution des instructions.
Nous présentons un nouveau benchmark CVIT qui évalue la capacité de généralisation à diverses instructions et tâches inconnues.
Il a été démontré expérimentalement que SMoLoRA surpasse les méthodes existantes.
Limitations:
Il est possible que les améliorations de performances de SMoLoRA soient limitées à des ensembles de données ou à des tâches spécifiques.
Une validation plus poussée de la généralité et de la polyvalence du nouveau référentiel proposé est nécessaire.
Manque d’analyse du coût informatique et de la complexité de SMoLoRA.
👍