本論文は、オーディオディープフェイク技術の発展がもたらす利点とともに、セキュリティ、プライバシー、デジタルコミュニケーションに対する信頼の低下などの重大なリスクを提起することを指摘しています。従来のオーディオディープフェイク検出データセットは、さまざまな民族のアクセントが不足しているため、実際の状況には適用しにくいという制限があり、特に南アジア地域の言語と文化的文脈では検出性能が低下します。この研究では、50人の英語を話すインド人の27.17時間分の本物のディープフェイクオーディオデータを含むIndieFake Dataset(IFD)を紹介します。 IFDはバランスの取れたデータ分布とスピーカー特性情報を提供し、既存のデータセットであるASVspoof21(DF)およびIn-The-Wild(ITW)データセットと比較してパフォーマンス評価を実行します。 IFDはASVspoof21(DF)より優れた性能を示し、ITWデータセットよりも難しいベンチマークであることを実証しています。データセットは研究目的で公にアクセス可能です。