Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

AUTALIC : un ensemble de données pour le langage capacitiste anti-autiste en contexte

Created by
  • Haebom

Auteur

Naba Rizvi, Harper Strickland, Daniel Gitelman, Tristan Cooper, Alexis Morales-Flores, Michael Golden, Aekta Kallepalli, Akshat Alurkar, Haaset Owens, Saleha Ahmedi, Isha Khirwadkar, Imani Munyaka, Nedjma Ousidhoum

Contour

À Mesure que la compréhension de l'autisme et du validisme progresse, celle du langage capacitiste associé à l'autisme progresse également. Ce langage présente des défis importants pour la recherche en PNL en raison de sa nature nuancée et contextuelle. Cependant, la détection du langage capacitiste anti-autiste reste un domaine inexploré, et les outils de PNL existants ne parviennent souvent pas à en saisir les expressions subtiles. Dans cet article, nous comblons cette lacune critique en présentant AUTALIC, le premier ensemble de données de référence dédié à la détection contextuelle du langage capacitiste anti-autiste. Cet ensemble de données comprend 2 400 phrases liées à l'autisme et leur contexte, collectées sur Reddit, et annotées par des experts expérimentés en neurodiversité. Des évaluations exhaustives démontrent que les modèles linguistiques actuels, y compris les LLM de pointe, peinent à identifier de manière fiable le validisme anti-autiste et à correspondre au jugement humain, soulignant ainsi les limites dans ce domaine. En publiant AUTALIC et ses annotations individuelles, nous offrons une ressource précieuse aux chercheurs qui étudient le validisme, la neurodiversité et les divergences dans les efforts d'annotation. Cet ensemble de données constitue une étape importante vers le développement de systèmes PNL plus complets et plus sensibles au contexte qui reflètent mieux des perspectives diverses.

Takeaways, Limitations_

Takeaways: A apporté une contribution significative à la recherche en PNL en fournissant AUTALIC, le premier ensemble de données de référence pour la détection du langage autistique-validiste. Cet ensemble a mis en évidence les limites des modèles linguistiques existants et la nécessité de systèmes de PNL plus complets. Il a également fourni des informations précieuses pour la recherche sur la neurodiversité et les études d'inadéquation des tâches d'annotation.
Limitations : Étant donné que l'ensemble de données est basé sur des données collectées sur Reddit, il peut refléter des caractéristiques spécifiques à la plateforme. Le problème d'incohérence des tâches d'annotation devrait être approfondi dans de futures recherches. Actuellement, il manque une analyse approfondie des causes des faibles performances des modèles linguistiques.
👍