[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Les cadres pragmatiques des corrélations parasites en apprentissage automatique : interpréter leur importance et leur importance

Created by
  • Haebom

Auteur

Samuel J. Bell, Skyler Wang

Contour

Cet article aborde l'apprentissage par corrélation à partir de données, fondement de la recherche en apprentissage automatique (ML) et en intelligence artificielle (IA). Les méthodes modernes permettent de découvrir automatiquement des schémas complexes, mais elles ont tendance à ne pas saisir les corrélations involontaires. Cette vulnérabilité a donné lieu à un nombre croissant de recherches sur les corrélations parasites, souvent perçues comme une menace pour la performance, l'équité et la robustesse des modèles. Dans cet article, nous allons au-delà de la définition statistique traditionnelle des corrélations parasites, qui désignent des relations non causales résultant du hasard ou de variables confondantes, et étudions comment leur signification est négociée dans la recherche en ML. Plutôt que de s'appuyer uniquement sur des définitions formelles, les chercheurs évaluent les corrélations parasites à travers ce que nous appelons un cadre pragmatique. Un cadre pragmatique est un jugement fondé sur l'effet réel de la corrélation : comment elle affecte le comportement du modèle, favorise ou entrave la performance de la tâche, ou s'aligne sur des objectifs normatifs plus larges. S'appuyant sur une analyse approfondie de la littérature sur l'apprentissage automatique, cet article identifie quatre cadres : la pertinence (« les modèles doivent utiliser des corrélations pertinentes pour la tâche »), la généralisabilité (« les modèles doivent utiliser des corrélations qui se généralisent à des données invisibles »), la ressemblance humaine (« les modèles doivent utiliser des corrélations que les humains utiliseraient pour effectuer la même tâche ») et la nocivité (« les modèles doivent utiliser des corrélations qui ne sont ni socialement ni éthiquement nuisibles »). Ces représentations démontrent que la désirabilité d'une corrélation n'est pas une propriété statistique fixe, mais un jugement situationnel éclairé par des considérations techniques, épistémologiques et éthiques. En examinant la manière dont les questions fondamentales de l'apprentissage automatique sont problématisées dans la littérature scientifique, cet article contribue à une discussion plus large sur les pratiques contingentes par lesquelles des concepts techniques tels que les corrélations aberrantes sont définis et opérationnalisés.

Takeaways, Limitations

Takeaways:
Nous montrons que l’opportunité de corrélation dans les modèles ML n’est pas une propriété statistique fixe mais un jugement situationnel.
Nous présentons une méthode d’évaluation des corrélations parasites à travers quatre cadres pratiques : la pertinence, la généralisabilité, la similarité humaine et la nocivité.
Présentation d’une approche multicouche de l’évaluation de la corrélation qui intègre des considérations techniques, épistémologiques et éthiques.
Fournit une compréhension plus approfondie de la manière d'aborder le problème de la corrélation parasite dans la recherche ML.
Limitations:
Des recherches supplémentaires sont nécessaires pour déterminer si les quatre cadres présentés sont des cadres universels applicables à toutes les situations.
Manque d’orientation claire sur l’importance relative et l’interaction de chaque cadre.
Manque de directives spécifiques sur le développement et le déploiement de modèles ML réels.
Des recherches supplémentaires sont nécessaires sur l’applicabilité du cadre à des algorithmes ou applications ML spécifiques.
👍