Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

When Deepfakes Look Real: Detecting AI-Generated Faces with Unlabeled Data due to Annotation Challenges

Created by
  • Haebom

作者

Zhiqiang Yang, Renshuai Tao, Xiaolong Zheng, Guodong Yang, Chunjie Zhang

概要

本論文は、既存のディープフェイク検出方法のLimitationsであるラベル付きデータ依存性を解決するために、大規模な非表示データを利用するデュアルパスガイドネットワーク(DPGNet)を提案します。 DPGNetは、異なる生成モデルの顔画像間のドメインギャップを解消し、非表示画像サンプルを利用する2つのコアモジュールで構成されています。最初のモジュールであるtext-guided cross-domain alignmentは、学習可能なプロンプトを使用して視覚的およびテキスト的な埋め込みをドメイン不変の特徴空間に統合し、2番目のモジュールであるcurriculum-driven pseudo label generationは情報豊富な非表示サンプルを動的に利用します。また、クロスドメイン知識蒸留による忘却問題を防止します。 11のデータセットでの実験の結果、DPGNetは従来の最高性能(SoTA)法より6.3%向上した性能を示しました。これは、ますます現実的に進化するディープフェイクの注釈の問題解決に非表示データを利用するDPGNetの効果を示しています。

Takeaways、Limitations

Takeaways:
大規模な非表示データを効果的に活用してディープフェイク検出性能を向上させる新しい方法を提示。
ドメインのギャップを減らし、非表示データを活用する効果的な戦略を提示します。
ディープフェイク検出の分野におけるアノテーション作業の難しさを軽減するための貢献
従来の最高性能モデルと比較して有意な性能向上を達成。
Limitations:
提案された方法の一般化性能のさらなる検証が必要である。
様々なタイプのディープフェイク生成モデルに対するロバースト性評価が必要
実際のオンラインソーシャルネットワーク環境でのパフォーマンス評価が必要です。
プロンプトエンジニアリングへの依存が存在する可能性。
👍