Cet article évalue la robustesse de CLIP, un modèle de classification à zéro coup utile dans les applications de défense avec des données étiquetées limitées, notamment dans les environnements militaires difficiles tels que l'occlusion partielle et un faible rapport signal/bruit. À l'aide d'un jeu de données personnalisé composé de 18 classes de véhicules militaires, nous étudions la robustesse de la variante CLIP à l'occlusion, en l'évaluant à l'aide de l'aire normalisée sous la courbe (NAUC) en fonction du taux d'occlusion. Les résultats expérimentaux démontrent que le modèle CLIP basé sur Transformer surpasse les CNN, les occlusions distribuées à granularité fine entraînant une dégradation des performances plus importante que les occlusions continues et grossières. De plus, nous démontrons que, si le modèle de sonde linéaire se dégrade rapidement à environ 35 % d'occlusion, un réglage fin du squelette permet une dégradation des performances même à 60 % d'occlusion ou plus.