VoxAging이라는 대규모의 장기간에 걸친 스피커 데이터셋을 소개한다. 이 데이터셋은 293명의 스피커(영어 226명, 중국어 67명)의 음성 데이터를 최대 17년(약 900주) 동안 주 단위로 수집한 것이다. 본 논문에서는 이 데이터셋을 활용하여 스피커 에이징 현상과 고급 스피커 인증 시스템에 미치는 영향, 개별 스피커의 에이징 과정, 연령대 및 성별과 같은 요인의 영향 등을 분석했다.
시사점, 한계점
•
시사점:
◦
대규모 장기간 스피커 에이징 데이터셋 VoxAging을 제공하여 스피커 에이징 연구에 중요한 기여를 함.
◦
스피커 에이징 현상과 그에 따른 스피커 인증 시스템 성능 저하에 대한 심층적인 분석을 제공함.
◦
연령대 및 성별 등 다양한 요인이 스피커 에이징에 미치는 영향을 분석함.
•
한계점:
◦
데이터 수집의 어려움으로 인해, 참여자 수가 제한적일 수 있음. (293명)
◦
특정 언어(영어, 중국어)에 집중되어 있어, 다른 언어에 대한 일반화에는 한계가 있을 수 있음.