[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Semantic Structure-Aware Generative Attacks for Enhanced Adversarial Transferability

Created by
  • Haebom

作者

Jongoh Jeong, Hunmin Yang, Jaeseok Jeong, Kuk-Jin Yoon

概要

本論文は、ホワイトボックスビッグチームモデルに適用するためにホワイトボックスサロゲートモデルで摂動ジェネレータを学習するための生成的敵対的攻撃について説明します。従来の反復攻撃とは対照的に、生成的敵対的攻撃は推論時間効率、スケーラビリティ、および転移性に優れていますが、既存の研究では生成モデルの表現能力を十分に活用して意味情報を保存および活用できませんでした。本論文では、ジェネレータの中間活性化は、オブジェクトの境界やおおよその形などの豊富な意味的特徴を含むが、これを十分に活用できず、摂動がオブジェクトに関連する領域との位置合わせが制限されることを指摘する。これを解決するために、本論文はMean Teacherベースの意味構造認識攻撃フレームワークを提案する。 Mean Teacherは時間的に平滑化された特徴参照として機能し、それによって学生モデルの初期層の活性化と意味的に豊富なTeacherモデルの活性化との間の意味的一貫性を特徴蒸留によって改善する。実験的結果に基づいて、発生器内の意味的に重要な初期中間ブロックに摂動発生を固定し、敵対的転移性を大幅に改善する領域に対する漸進的な敵対的摂動を誘導する。さまざまなモデル、ドメイン、およびタスクの広範な実験を通じて、既存の最先端の生成攻撃と比較して一貫したパフォーマンス向上を示し、既存の指標と新しく提案されたAccidental Correction Rate(ACR)を使用して総合的に評価します。

Takeaways、Limitations

Takeaways:
生成的敵対的攻撃の転移性を向上させる新しいフレームワークの提示
セマンティック情報を活用して摂動のオブジェクト関連領域との整列を改善
Mean Teacherベースの意味構造認識攻撃フレームワークの有効性検証
新しい評価指標であるACRの提示
さまざまなモデル、ドメイン、タスクに関する広範な実験結果の提示
Limitations:
Mean Teacherの使用による計算コストの増加の可能性
ACR指標の一般的な適用性に関するさらなる研究が必要
特定の生成モデルに対する依存性の存在可能性
実験環境の制約による一般化の可能性のさらなる検証が必要
👍