À Mesure que la compréhension de l'autisme et du validisme progresse, celle du langage capacitiste associé à l'autisme progresse également. Ce langage présente des défis importants pour la recherche en PNL en raison de sa nature nuancée et contextuelle. Cependant, la détection du langage capacitiste anti-autiste reste un domaine inexploré, et les outils de PNL existants ne parviennent souvent pas à en saisir les expressions subtiles. Dans cet article, nous comblons cette lacune critique en présentant AUTALIC, le premier ensemble de données de référence dédié à la détection contextuelle du langage capacitiste anti-autiste. Cet ensemble de données comprend 2 400 phrases liées à l'autisme et leur contexte, collectées sur Reddit, et annotées par des experts expérimentés en neurodiversité. Des évaluations exhaustives démontrent que les modèles linguistiques actuels, y compris les LLM de pointe, peinent à identifier de manière fiable le validisme anti-autiste et à correspondre au jugement humain, soulignant ainsi les limites dans ce domaine. En publiant AUTALIC et ses annotations individuelles, nous offrons une ressource précieuse aux chercheurs qui étudient le validisme, la neurodiversité et les divergences dans les efforts d'annotation. Cet ensemble de données constitue une étape importante vers le développement de systèmes PNL plus complets et plus sensibles au contexte qui reflètent mieux des perspectives diverses.