본 연구는 인공지능 음성 생성 및 음성 복제 기술의 발전이 다양한 억양과 언어적 특성을 가진 사회기술 시스템에 미치는 영향을 완전히 이해하지 못하고 있다는 점을 바탕으로, Speechify와 ElevenLabs 두 가지 AI 음성 서비스를 설문조사와 인터뷰를 통한 혼합방법론으로 평가했습니다. 다섯 가지 지역 영어 억양에 대한 기술적 성능 차이를 밝히고, 현재의 음성 생성 기술이 어떻게 의도치 않게 언어적 특권과 억양 기반 차별을 강화하여 새로운 형태의 디지털 배제를 초래할 수 있는지 보여줍니다. 결론적으로, 개발자, 정책 입안자 및 기관에 공정하고 사회적으로 책임감 있는 AI 음성 기술을 보장하기 위한 실행 가능한 통찰력을 제공합니다.