Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

AUTALIC: A Dataset for Anti-AUTistic Ableist Language In Context

Created by
  • Haebom

作者

Naba Rizvi, Harper Strickland, Daniel Gitelman, Tristan Cooper, Alexis Morales-Flores, Michael Golden, Aekta Kallepalli, Akshat Alurkar, Haaset Owens, Saleha Ahmedi, Isha Khirwadkar, Imani Munyaka, Nedjma Ousidhoum

概要

自閉症と能力主義の理解が高まるにつれて、自閉症者に対する能力主義言語の理解も高まっています。これらの言語は、微妙で文脈に依存する性質のために、NLP研究にかなりの困難を提示します。しかし、半自閉症能力主義的言語の検出はまだ未開拓の分野であり、既存のNLPツールはしばしばその微妙な表現を捉えていません。本論文では、文脈における半自閉症能力主義的言語検出に専念する最初のベンチマークデータセットであるAUTALICを提示し、この分野の重要な隙間を解消します。このデータセットは、Redditによって収集された2,400の自閉症関連の文章と周辺の文脈で構成され、神経多様性分野の背景を持つ熟練した専門家が注釈を付けました。包括的な評価の結果、最先端のLLMを含む現在の言語モデルは、半自閉症能力主義を確実に識別し、人間の判断と一致するのが困難であることを示しており、この分野での限界を強調しています。 AUTALICは、個々の注釈とともに公に公開され、能力主義、神経多様性、および注釈作業の不一致を研究する研究者に貴重な資料として提供します。このデータセットは、さまざまな視点をよりよく反映する、より包括的でコンテキスト認識NLPシステムを開発するための重要なステップです。

Takeaways、Limitations

Takeaways:半自閉症能力主義言語検出のための最初のベンチマークデータセットであるAUTALICを提供し、NLP研究に重要な貢献をします。既存の言語モデルの限界を明らかにし、より包括的なNLPシステム開発の必要性を強調する。神経多様性研究と注釈作業の不一致研究に貴重な資料を提供する。
Limitations:データセットはRedditから収集されたデータに基づいているため、特定のプラットフォームの特性を反映できます。注釈作業の不一致の問題は、今後の研究でさらに詳しく説明する必要があります。現在の言語モデルの性能低下の原因の詳細な分析が不足している。
👍