Cet article souligne l'importance de l'entraînement des modèles d'apprentissage automatique pour bien comprendre les facteurs qui définissent chaque classe. Des études antérieures se sont concentrées sur l'identification de corrélations parasites dans les ensembles de données en s'appuyant uniquement sur l'analyse des données ou des erreurs, mais n'ont pas réussi à détecter les corrélations parasites apprises par les modèles qui ne sont pas révélées par des contre-exemples dans les ensembles de validation ou d'entraînement. Pour surmonter ces limitations, cet article propose WASP (Weight-space Approach to Detecting Spuriousness), une nouvelle méthode qui analyse les pondérations du modèle, le mécanisme de prise de décision, plutôt que ses prédictions. WASP analyse comment les pondérations du modèle de base évoluent dans une direction qui capture diverses corrélations (parasites) lors du réglage fin d'un ensemble de données spécifique. Contrairement aux études précédentes, WASP (i) expose des corrélations parasites dans des ensembles de données qui ne sont pas révélées par des contre-exemples de formation ou de validation, (ii) fonctionne sur diverses modalités, telles que les images et le texte, et (iii) démontre sa capacité à détecter des corrélations parasites jusque-là inconnues apprises par le classificateur ImageNet-1k.