Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

"It's not a representation of me": Examining Accent Bias and Digital Exclusion in Synthetic AI Voice Services

Created by
  • Haebom

저자

Shira Michel, Sufi Kaur, Sarah Elizabeth Gillespie, Jeffrey Gleason, Christo Wilson, Avijit Ghosh

개요

본 연구는 인공지능 음성 생성 및 음성 복제 기술의 발전이 다양한 악센트와 언어적 특성을 가진 사회기술 시스템에 미치는 영향을 완전히 이해하지 못하고 있음을 지적하며, 두 가지 AI 음성 서비스(Speechify와 ElevenLabs)를 혼합 방법론(설문조사와 인터뷰)을 통해 평가하여 기술적 성능을 평가하고 사용자의 경험이 이러한 음성 기술에서 악센트 변화에 대한 인식에 어떻게 영향을 미치는지 밝히고자 하였다. 다섯 가지 지역별 영어 악센트에 걸쳐 기술적 성능의 차이를 보여주고, 현재의 음성 생성 기술이 의도치 않게 언어적 특권과 악센트 기반 차별을 강화하여 새로운 형태의 디지털 배제를 만들어낼 수 있음을 보여준다. 결론적으로, 개발자, 정책 입안자 및 조직에게 공정하고 사회적으로 책임감 있는 AI 음성 기술을 보장하기 위한 실행 가능한 통찰력을 제공함으로써 포괄적인 설계 및 규제의 필요성을 강조한다.

시사점, 한계점

시사점:
AI 음성 생성 기술의 기술적 성능이 악센트에 따라 차이가 있음을 밝힘.
현재 기술이 언어적 특권을 강화하고 악센트 기반 차별을 야기할 수 있음을 시사.
디지털 배제의 새로운 형태를 초래할 가능성 제기.
개발자, 정책 입안자, 조직을 위한 포괄적인 설계 및 규제의 필요성 강조.
AI 음성 기술의 사회적 영향에 대한 실행 가능한 통찰력 제공.
한계점:
연구 대상 서비스가 Speechify와 ElevenLabs 두 가지로 제한적임.
평가 대상 악센트가 다섯 가지 지역 영어로 한정됨.
설문조사와 인터뷰를 통한 혼합 방법론의 한계 존재.
다른 언어나 더 광범위한 악센트에 대한 일반화 가능성 제한.
👍