Cet article aborde l'apprentissage par corrélation à partir de données, fondement de la recherche en apprentissage automatique (ML) et en intelligence artificielle (IA). Les méthodes modernes permettent de découvrir automatiquement des schémas complexes, mais elles ont tendance à ne pas saisir les corrélations involontaires. Cette vulnérabilité a donné lieu à un nombre croissant de recherches sur les corrélations parasites, souvent perçues comme une menace pour la performance, l'équité et la robustesse des modèles. Dans cet article, nous allons au-delà de la définition statistique traditionnelle des corrélations parasites, qui désignent des relations non causales résultant du hasard ou de variables confondantes, et étudions comment leur signification est négociée dans la recherche en ML. Plutôt que de s'appuyer uniquement sur des définitions formelles, les chercheurs évaluent les corrélations parasites à travers ce que nous appelons un cadre pragmatique. Un cadre pragmatique est un jugement fondé sur l'effet réel de la corrélation : comment elle affecte le comportement du modèle, favorise ou entrave la performance de la tâche, ou s'aligne sur des objectifs normatifs plus larges. S'appuyant sur une analyse approfondie de la littérature sur l'apprentissage automatique, cet article identifie quatre cadres : la pertinence (« les modèles doivent utiliser des corrélations pertinentes pour la tâche »), la généralisabilité (« les modèles doivent utiliser des corrélations qui se généralisent à des données invisibles »), la ressemblance humaine (« les modèles doivent utiliser des corrélations que les humains utiliseraient pour effectuer la même tâche ») et la nocivité (« les modèles doivent utiliser des corrélations qui ne sont ni socialement ni éthiquement nuisibles »). Ces représentations démontrent que la désirabilité d'une corrélation n'est pas une propriété statistique fixe, mais un jugement situationnel éclairé par des considérations techniques, épistémologiques et éthiques. En examinant la manière dont les questions fondamentales de l'apprentissage automatique sont problématisées dans la littérature scientifique, cet article contribue à une discussion plus large sur les pratiques contingentes par lesquelles des concepts techniques tels que les corrélations aberrantes sont définis et opérationnalisés.