Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

IndieFake Dataset: A Benchmark Dataset for Audio Deepfake Detection

Created by
  • Haebom

作者

Abhay Kumar, Kunal Verma, Omkar More

概要

本論文は、オーディオディープフェイク技術の発展がもたらす利点とともに、セキュリティ、プライバシー、デジタルコミュニケーションに対する信頼の低下などの重大なリスクを提起することを指摘しています。従来のオーディオディープフェイク検出データセットは、さまざまな民族のアクセントが不足しているため、実際の状況には適用しにくいという制限があり、特に南アジア地域の言語と文化的文脈では検出性能が低下します。この研究では、50人の英語を話すインド人の27.17時間分の本物のディープフェイクオーディオデータを含むIndieFake Dataset(IFD)を紹介します。 IFDはバランスの取れたデータ分布とスピーカー特性情報を提供し、既存のデータセットであるASVspoof21(DF)およびIn-The-Wild(ITW)データセットと比較してパフォーマンス評価を実行します。 IFDはASVspoof21(DF)より優れた性能を示し、ITWデータセットよりも難しいベンチマークであることを実証しています。データセットは研究目的で公にアクセス可能です。

Takeaways、Limitations

Takeaways:
オーディオディープフェイク検出性能を向上させるための新しいデータセット(IFD)を提供
南アジア言語と文化的文脈を考慮したオーディオディープフェイク検出研究に貢献
さまざまな民族アクセントを含むデータセットの重要性を強調
パブリックデータセットによるオーディオディープフェイク研究の有効化
Limitations:
現在、データセットは英語を話すインド人に限定されています。他の言語や地域のデータ拡張が必要です。
データセットのサイズがより大きい規模の研究のために拡張される必要がある。
オーディオディープフェイク技術の継続的な進歩に伴い、データセットの継続的な更新が必要です。
👍