본 논문은 오디오 딥페이크 기술의 발전이 가져오는 이점과 함께 보안, 프라이버시, 디지털 커뮤니케이션에 대한 신뢰 저하와 같은 심각한 위험성을 제기한다는 점을 지적합니다. 기존의 오디오 딥페이크 탐지 데이터셋은 다양한 민족의 악센트가 부족하여 실제 상황에 적용하기 어렵다는 한계를 가지고 있으며, 특히 남아시아 지역의 언어 및 문화적 맥락에서는 탐지 성능이 저하됩니다. 이에 본 연구는 50명의 영어를 사용하는 인도인의 27.17시간 분량의 진짜 및 딥페이크 오디오 데이터를 포함하는 IndieFake Dataset (IFD)을 제시합니다. IFD는 균형 잡힌 데이터 분포와 스피커 특성 정보를 제공하며, 기존 데이터셋인 ASVspoof21 (DF) 및 In-The-Wild (ITW) 데이터셋과 비교하여 성능 평가를 수행합니다. IFD는 ASVspoof21 (DF)보다 우수한 성능을 보이며, ITW 데이터셋보다 더 어려운 벤치마크임을 입증합니다. 데이터셋은 연구 목적으로 공개적으로 접근 가능합니다.