本論文は,ディープフェイクオーディオ検出の脆弱性を解決するための新しい共同学習方法であるSHIELDを提案する。従来のディープフェイクオーディオ検出方法は、敵対的生成ネットワークベースのアンチフォレン攻撃(AF)攻撃に対して脆弱であることを実験的に示しており、これを防御するために防御生成モデル(DF)を統合したコラボレーション学習フレームワークを設計しました。 SHIELDは、実際およびAF攻撃オーディオと、補助生成モデルを使用して生成された実際および攻撃オーディオとの間の相関関係を捉える三重項モデルを使用します。 ASVspoof2019、In-the-Wild、HalfTruthデータセットでは、さまざまな生成モデルに対して強力なパフォーマンスを発揮し、AF攻撃による検出精度の低下を効果的に軽減します。