Reinforcing Stereotypes of Anger: Emotion AI on African American Vernacular English
Created by
Haebom
Category
Empty
저자
Rebecca Dorn, Christina Chance, Casandra Rusti, Charles Bickham Jr., Kai-Wei Chang, Fred Morstatter, Kristina Lerman
개요
본 연구는 감정 인식 모델이 아프리카계 미국 영어(AAVE)와 일반 미국 영어(GAE) 간의 감정 표현을 어떻게 다르게 인식하는지 조사합니다. 연구는 로스앤젤레스에서 지리적으로 태그된 270만 개의 트윗을 분석하고, AAVE의 강도를 계산하여 AAVE 밀도가 높은 트윗을 아프리카계 미국인 및 AAVE 능숙자(내집단)가 감정의 존재와 강도를 주석 처리한 875개의 트윗 데이터세트를 활용합니다. GPT 및 BERT 기반 모델이 AAVE에서 분노에 대한 거짓 긍정 예측률이 GAE보다 두 배 이상 높다는 것을 발견했습니다. 인기 있는 텍스트 기반 감정 모델인 SpanEmo는 GAE에서 25%에서 AAVE에서 60%로 분노에 대한 거짓 긍정률을 증가시켰습니다. 또한, 모델과 비내집단 주석은 내집단 주석보다 욕설 기반 AAVE 특징과 더 유의미한 상관관계를 보였습니다. 인구 통계학적 데이터를 연결하여 아프리카계 미국인 거주 비율이 높은 지역이 더 높은 분노 예측(Pearson 상관관계 r = 0.27) 및 더 낮은 기쁨 예측(r = -0.10)과 관련이 있음을 관찰했습니다. 이러한 결과는 감정 AI가 편향된 감정 분류를 통해 인종적 고정관념을 강화하는 안전 문제를 발견했으며, 문화 및 방언 정보를 제공하는 감정 컴퓨팅 시스템의 필요성을 강조합니다.
시사점, 한계점
•
감정 인식 모델이 AAVE에서 분노를 과도하게 예측하여 인종적 편견을 드러냄.
•
GPT 및 BERT 기반 모델이 GAE에 비해 AAVE에서 분노에 대한 거짓 긍정 예측률이 더 높음.