Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

ToxSyn: Reducing Bias in Hate Speech Detection via Synthetic Minority Data in Brazilian Portuguese

Created by
  • Haebom
Category
Empty

저자

Iago Alves Brito, Julia Soares Dollis, Fernanda Bufon Farber, Diogo Fernandes Costa Silva, Arlindo Rodrigues Galvao Filho

개요

ToxSyn은 포르투갈어를 대상으로 하는 대규모 멀티 레이블 혐오 발언 감지 코퍼스입니다. 9개의 보호 소수자 집단을 대상으로 하며, 독성 언어의 수사적 전략을 포착하기 위해 담론 유형 주석을 포함합니다. 다른 공개 데이터 세트에서 누락된 비독성 반례를 체계적으로 포함하고 있습니다. 실험 결과 소셜 미디어 도메인과 ToxSyn 간에 상호 일반화 실패가 발생하여, 모델이 소셜 미디어에서 훈련된 경우 소수자 관련 맥락에 일반화하는 데 어려움을 겪고, 반대의 경우도 마찬가지임을 밝혔습니다.

시사점, 한계점

ToxSyn은 포르투갈어를 위한 최초의 대규모 혐오 발언 감지 데이터 세트입니다.
9개의 보호 소수자 집단을 대상으로 하는 멀티 레이블 혐오 발언 감지 데이터 세트입니다.
비독성 반례를 포함하여 혐오 표현과 단순히 논의하는 텍스트를 구별할 수 있습니다.
소셜 미디어 도메인과 ToxSyn 간의 상호 일반화 실패를 발견하여, 모델의 성능 평가 지표인 Macro F1의 신뢰성에 의문을 제기합니다.
제한된 언어(포르투갈어)에 특화되어 있으며, 다른 언어에 대한 일반화는 확인되지 않았습니다.
데이터 생성 방식에 대한 상세한 내용은 논문에 제시되어야 하며, 합성 데이터 생성의 한계를 고려해야 합니다.
👍