Dans cet article, nous proposons un cadre de régularisation d'alignement textuel parasite (StarFT) pour résoudre le problème de la dégradation rapide de l'apprentissage de représentations robustes de modèles à alignement nul tels que CLIP lorsqu'ils sont affinés sur des tâches en aval. Alors que les études précédentes se concentraient sur le déplacement de domaines, cet article se concentre sur la tendance des modèles affinés avec des données limitées à apprendre des caractéristiques dénuées de sens pour l'humain, telles que l'arrière-plan ou la texture. StarFT améliore la robustesse des modèles à alignement nul grâce à une régularisation qui empêche l'apprentissage de caractéristiques dénuées de sens en générant des descriptions textuelles alternatives mettant en valeur des caractéristiques potentiellement déroutantes. Les résultats expérimentaux montrent que StarFT surpasse d'autres modèles de base robustes et affinés, notamment dans le scénario de déplacement de groupes d'oiseaux aquatiques.