본 연구는 인공지능 음성 생성 및 음성 복제 기술의 발전이 다양한 악센트와 언어적 특성을 가진 사회기술 시스템에 미치는 영향을 완전히 이해하지 못하고 있음을 지적하며, 두 가지 AI 음성 서비스(Speechify와 ElevenLabs)를 혼합 방법론(설문조사와 인터뷰)을 통해 평가하여 기술적 성능을 평가하고 사용자의 경험이 이러한 음성 기술에서 악센트 변화에 대한 인식에 어떻게 영향을 미치는지 밝히고자 하였다. 다섯 가지 지역별 영어 악센트에 걸쳐 기술적 성능의 차이를 보여주고, 현재의 음성 생성 기술이 의도치 않게 언어적 특권과 악센트 기반 차별을 강화하여 새로운 형태의 디지털 배제를 만들어낼 수 있음을 보여준다. 결론적으로, 개발자, 정책 입안자 및 조직에게 공정하고 사회적으로 책임감 있는 AI 음성 기술을 보장하기 위한 실행 가능한 통찰력을 제공함으로써 포괄적인 설계 및 규제의 필요성을 강조한다.