Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

StarFT : réglage fin robuste des modèles Zero-shot via l'alignement des parasites

Created by
  • Haebom

Auteur

Younghyun Kim, Jongheon Jeong, Sangkyung Kwak, Kyungmin Lee, Juho Lee, Jinwoo Shin

Contour

Dans cet article, nous proposons un cadre de régularisation d'alignement textuel parasite (StarFT) pour résoudre le problème de la dégradation rapide de l'apprentissage de représentations robustes de modèles à alignement nul tels que CLIP lorsqu'ils sont affinés sur des tâches en aval. Alors que les études précédentes se concentraient sur le déplacement de domaines, cet article se concentre sur la tendance des modèles affinés avec des données limitées à apprendre des caractéristiques dénuées de sens pour l'humain, telles que l'arrière-plan ou la texture. StarFT améliore la robustesse des modèles à alignement nul grâce à une régularisation qui empêche l'apprentissage de caractéristiques dénuées de sens en générant des descriptions textuelles alternatives mettant en valeur des caractéristiques potentiellement déroutantes. Les résultats expérimentaux montrent que StarFT surpasse d'autres modèles de base robustes et affinés, notamment dans le scénario de déplacement de groupes d'oiseaux aquatiques.

Takeaways, Limitations

Takeaways:
Une nouvelle solution au problème de dégradation de la robustesse qui se produit lors du réglage fin des modèles à tir nul.
Améliorer la robustesse des modèles zero-shot en évitant d'apprendre des fonctionnalités sans signification.
Amélioration significative des performances dans le scénario de déplacement des groupes d'oiseaux aquatiques (précision du groupe la plus mauvaise 14,30 %, précision moyenne 3,02 % d'amélioration).
Amélioration de la robustesse du groupe zéro-shot et des performances de classification zéro-shot.
Limitations:
Des recherches supplémentaires sont nécessaires sur les performances de généralisation de la méthode proposée.
Des expériences supplémentaires sur diverses tâches et ensembles de données en aval sont nécessaires.
Dépendance à l’exactitude de la génération de descriptions de texte alternatives qui mettent en évidence des caractéristiques potentiellement déroutantes.
👍