Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

DATABench: Evaluating Dataset Auditing in Deep Learning from an Adversarial Perspective

Created by
  • Haebom

作者

Shuo Shao, Yiming Li, Mengren Zheng, Zhiyang Hu, Yukun Chen, Boheng Li, Yu He, Junfeng Guo, Dacheng Tao, Zhan Qin

概要

この論文では、ディープラーニングモデルのトレーニングに使用されるデータセットの透明性の欠如によるプライバシーと著作権の問題を解決するために、データセット監査技術の研究を進めています。既存のデータセット監査手法の敵対的攻撃に対する脆弱性を分析し、内部特徴(IF)と外部特徴(EF)ベースの方法に分類する新しい分類体系を提示します。また、データセットの使用を隠蔽する回避攻撃と、未使用のデータセットを虚偽とする偽造攻撃という2つの主な攻撃タイプを定義し、各攻撃タイプに対する体系的な攻撃戦略(回避攻撃のための分離、除去、検出、偽造攻撃のための敵対的な例示ベースの方法)を提案します。最後に、17の回避攻撃、5つの偽造攻撃、および9つの代表的な監査手法で構成された新しいベンチマークDATABenchを提示し、評価の結果、既存の監査手法が敵対的な環境で十分に強力または区別されていないことを示しています。

Takeaways、Limitations

Takeaways:
データセット監査技術の敵対的な攻撃に対する脆弱性を体系的に分析し、新しいベンチマークDATABenchを提供することで、今後の研究の方向性を提供します。
内部特徴(IF)と外部特徴(EF)ベースの方法で既存の監査手法を分類する新しい分類スキームを提案します。
回避攻撃と偽造攻撃のための体系的な攻撃戦略を提示します。
Limitations:
現在のデータセット監査手法は敵対的な攻撃に対して脆弱であることを示していますが、より強力で信頼性の高い監査手法の開発に対する具体的な解決策はありません。
DATABenchに含まれる攻撃と監査技術の種類は限られている可能性があります。将来的には、さまざまな攻撃や監査手法を含むベンチマークを拡張する必要があります。
👍