Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Do AI Voices Learn Social Nuances? A Case of Politeness and Speech Rate

Created by
  • Haebom
Category
Empty

저자

Eyal Rabin, Zohar Elyoseph, Rotem Israel-Fishelson, Adi Dali, Ravit Nussinson

개요

본 연구는 음성 기반 인공지능이 명시적으로 프로그래밍되지 않은 암묵적인 신호를 학습할 수 있는지 탐구한다. 특히, 최첨단 텍스트 음성 변환 시스템이 인간의 공손함 표현을 위해 속도를 늦추는 경향을 내재화했는지 조사했다. 두 주요 AI 플랫폼(AI Studio 및 OpenAI)에서 22개의 합성 음성에 "공손하고 격식 있는" 상황과 "격식 없고 편안한" 상황에서 동일한 스크립트를 읽도록 하여 음성 지속 시간을 측정했다. 그 결과, 두 플랫폼 모두에서 공손한 프롬프트가 캐주얼한 프롬프트보다 더 느린 속도로 말했으며, 이는 AI Studio의 모든 음성과 OpenAI의 대다수 음성에서 통계적으로 유의미했다.

시사점, 한계점

AI가 인간 의사소통의 심리적 뉘앙스를 암묵적으로 학습하고 복제할 수 있음을 입증.
AI가 인간 사회 규범을 강화하는 사회적 행위자로서의 역할을 수행할 수 있음을 시사.
연구는 특정 플랫폼의 합성 음성에만 국한되어 일반화에 제한이 있음.
공손함 외 다른 암묵적 신호 학습 여부에 대한 추가 연구 필요.
다양한 상황 및 텍스트에 대한 추가 분석 필요.
👍