Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Reinforcing Stereotypes of Anger: Emotion AI on African American Vernacular English

Created by
  • Haebom
Category
Empty

저자

Rebecca Dorn, Christina Chance, Casandra Rusti, Charles Bickham Jr., Kai-Wei Chang, Fred Morstatter, Kristina Lerman

개요

본 연구는 감정 인식 모델이 아프리카계 미국 영어(AAVE)와 일반 미국 영어(GAE) 간의 감정 표현을 어떻게 다르게 인식하는지 조사합니다. 연구는 로스앤젤레스에서 지리적으로 태그된 270만 개의 트윗을 분석하고, AAVE의 강도를 계산하여 AAVE 밀도가 높은 트윗을 아프리카계 미국인 및 AAVE 능숙자(내집단)가 감정의 존재와 강도를 주석 처리한 875개의 트윗 데이터세트를 활용합니다. GPT 및 BERT 기반 모델이 AAVE에서 분노에 대한 거짓 긍정 예측률이 GAE보다 두 배 이상 높다는 것을 발견했습니다. 인기 있는 텍스트 기반 감정 모델인 SpanEmo는 GAE에서 25%에서 AAVE에서 60%로 분노에 대한 거짓 긍정률을 증가시켰습니다. 또한, 모델과 비내집단 주석은 내집단 주석보다 욕설 기반 AAVE 특징과 더 유의미한 상관관계를 보였습니다. 인구 통계학적 데이터를 연결하여 아프리카계 미국인 거주 비율이 높은 지역이 더 높은 분노 예측(Pearson 상관관계 r = 0.27) 및 더 낮은 기쁨 예측(r = -0.10)과 관련이 있음을 관찰했습니다. 이러한 결과는 감정 AI가 편향된 감정 분류를 통해 인종적 고정관념을 강화하는 안전 문제를 발견했으며, 문화 및 방언 정보를 제공하는 감정 컴퓨팅 시스템의 필요성을 강조합니다.

시사점, 한계점

감정 인식 모델이 AAVE에서 분노를 과도하게 예측하여 인종적 편견을 드러냄.
GPT 및 BERT 기반 모델이 GAE에 비해 AAVE에서 분노에 대한 거짓 긍정 예측률이 더 높음.
SpanEmo 모델 역시 AAVE에서 분노에 대한 거짓 긍정률이 크게 증가함.
모델의 예측이 욕설 기반 AAVE 특징과 더 강하게 연관되어 있음.
아프리카계 미국인 거주 비율이 높은 지역에서 분노 예측이 높고 기쁨 예측이 낮음.
문화 및 방언을 고려한 감정 컴퓨팅 시스템의 필요성을 강조함.
연구는 특정 지역(로스앤젤레스)의 트윗 데이터에 국한됨.
모델 평가에 사용된 주석은 "실버" 레이블로, 완벽한 정확성을 보장하지 않음.
AAVE의 강도를 계산하는 데 사용된 방법이 완벽하게 정확하지 않을 수 있음.
👍