Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

IndieFake Dataset: A Benchmark Dataset for Audio Deepfake Detection

Created by
  • Haebom

저자

Abhay Kumar, Kunal Verma, Omkar More

개요

본 논문은 오디오 딥페이크 기술의 발전이 가져오는 이점과 함께 보안, 프라이버시, 디지털 커뮤니케이션에 대한 신뢰 저하와 같은 심각한 위험성을 제기한다는 점을 지적합니다. 기존의 오디오 딥페이크 탐지 데이터셋은 다양한 민족의 악센트가 부족하여 실제 상황에 적용하기 어렵다는 한계를 가지고 있으며, 특히 남아시아 지역의 언어 및 문화적 맥락에서는 탐지 성능이 저하됩니다. 이에 본 연구는 50명의 영어를 사용하는 인도인의 27.17시간 분량의 진짜 및 딥페이크 오디오 데이터를 포함하는 IndieFake Dataset (IFD)을 제시합니다. IFD는 균형 잡힌 데이터 분포와 스피커 특성 정보를 제공하며, 기존 데이터셋인 ASVspoof21 (DF) 및 In-The-Wild (ITW) 데이터셋과 비교하여 성능 평가를 수행합니다. IFD는 ASVspoof21 (DF)보다 우수한 성능을 보이며, ITW 데이터셋보다 더 어려운 벤치마크임을 입증합니다. 데이터셋은 연구 목적으로 공개적으로 접근 가능합니다.

시사점, 한계점

시사점:
오디오 딥페이크 탐지 성능 향상을 위한 새로운 데이터셋 (IFD) 제공
남아시아 언어 및 문화적 맥락을 고려한 오디오 딥페이크 탐지 연구에 기여
다양한 민족 악센트를 포함한 데이터셋의 중요성 강조
공개 데이터셋을 통한 오디오 딥페이크 연구 활성화
한계점:
현재 데이터셋은 영어를 사용하는 인도인에만 국한됨. 다른 언어 및 지역의 데이터 확장 필요.
데이터셋의 크기가 더 큰 규모의 연구를 위해서는 확장될 필요가 있음.
오디오 딥페이크 기술의 지속적인 발전에 따라 데이터셋의 지속적인 업데이트가 필요.
👍