Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

AUTALIC: A Dataset for Anti-AUTistic Ableist Language In Context

Created by
  • Haebom

저자

Naba Rizvi, Harper Strickland, Daniel Gitelman, Tristan Cooper, Alexis Morales-Flores, Michael Golden, Aekta Kallepalli, Akshat Alurkar, Haaset Owens, Saleha Ahmedi, Isha Khirwadkar, Imani Munyaka, Nedjma Ousidhoum

개요

자폐증과 능력주의에 대한 이해가 증가함에 따라 자폐인에 대한 능력주의적 언어에 대한 이해도 높아지고 있습니다. 이러한 언어는 미묘하고 문맥에 의존적인 성격 때문에 NLP 연구에 상당한 어려움을 제시합니다. 그러나 반자폐증 능력주의적 언어의 탐지는 아직 미개척 분야이며, 기존 NLP 도구는 종종 그 미묘한 표현을 포착하지 못합니다. 본 논문에서는 문맥에서 반자폐증 능력주의적 언어 탐지에 전념하는 최초의 벤치마크 데이터 세트인 AUTALIC을 제시하여 이 분야의 중요한 간극을 해소합니다. 이 데이터 세트는 Reddit에서 수집한 2,400개의 자폐증 관련 문장과 주변 문맥으로 구성되며, 신경다양성 분야의 배경을 가진 숙련된 전문가가 주석을 달았습니다. 포괄적인 평가 결과, 최첨단 LLM을 포함한 현재 언어 모델은 반자폐증 능력주의를 안정적으로 식별하고 인간의 판단과 일치하는 데 어려움을 겪는다는 것을 보여주어 이 영역에서의 한계를 강조합니다. AUTALIC을 개별 주석과 함께 공개적으로 공개하여 능력주의, 신경다양성 및 주석 작업의 불일치를 연구하는 연구원에게 귀중한 자료로 제공합니다. 이 데이터 세트는 다양한 관점을 더 잘 반영하는 더 포괄적이고 문맥 인식 NLP 시스템을 개발하는 데 중요한 단계입니다.

시사점, 한계점

시사점: 반자폐증 능력주의적 언어 탐지를 위한 최초의 벤치마크 데이터 세트인 AUTALIC을 제공하여 NLP 연구에 중요한 기여를 함. 현존하는 언어 모델의 한계를 밝히고, 더욱 포괄적인 NLP 시스템 개발의 필요성을 강조함. 신경다양성 연구 및 주석 작업 불일치 연구에 귀중한 자료 제공.
한계점: 데이터 세트가 Reddit에서 수집된 데이터에 기반하기 때문에, 특정 플랫폼의 특성을 반영할 수 있음. 주석 작업의 불일치 문제는 향후 연구에서 더욱 자세히 다루어야 함. 현재 언어 모델의 성능 저하 원인에 대한 심층적인 분석이 부족함.
👍