Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

VoxAging: Continuously Tracking Speaker Aging with a Large-Scale Longitudinal Dataset in English and Mandarin

Created by
  • Haebom

저자

Zhiqi Ai, Meixuan Bao, Zhiyong Chen, Zhi Yang, Xinnuo Li, Shugong Xu

개요

VoxAging이라는 대규모의 장기간에 걸친 스피커 데이터셋을 소개한다. 이 데이터셋은 293명의 스피커(영어 226명, 중국어 67명)의 음성 데이터를 최대 17년(약 900주) 동안 주 단위로 수집한 것이다. 본 논문에서는 이 데이터셋을 활용하여 스피커 에이징 현상과 고급 스피커 인증 시스템에 미치는 영향, 개별 스피커의 에이징 과정, 연령대 및 성별과 같은 요인의 영향 등을 분석했다.

시사점, 한계점

시사점:
대규모 장기간 스피커 에이징 데이터셋 VoxAging을 제공하여 스피커 에이징 연구에 중요한 기여를 함.
스피커 에이징 현상과 그에 따른 스피커 인증 시스템 성능 저하에 대한 심층적인 분석을 제공함.
연령대 및 성별 등 다양한 요인이 스피커 에이징에 미치는 영향을 분석함.
한계점:
데이터 수집의 어려움으로 인해, 참여자 수가 제한적일 수 있음. (293명)
특정 언어(영어, 중국어)에 집중되어 있어, 다른 언어에 대한 일반화에는 한계가 있을 수 있음.
장기간 데이터 수집의 어려움으로 인해, 더욱 긴 기간의 데이터 확보가 어려움.
👍