Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Is my Data in your AI Model? Membership Inference Test with Application to Face Images

Created by
  • Haebom

作者

Daniel DeAlcala, Aythami Morales, Julian Fierrez, Gonzalo Mancera, Ruben Tolosana, Javier Ortega-Garcia

概要

本論文では、AI/MLモデルの学習過程で特定のデータが使用されたかどうかを経験的に評価するための新しいアプローチであるメンバーシップ推論テスト(MINT)を紹介します。 MINTは、監査対象モデルが学習データにさらされたときに現れる固有の活性化パターンを学習するように設計された2つのアーキテクチャ(多層パーセプトロン(MLP)と合成積ニューラルネットワーク(CNN)ベース)を提案します。実験は、3つの最先端の顔認識システムを考慮して、顔認識という難しい課題に焦点を当て、合計2200万を超える顔画像を含む6つの公開データベースを使用して行われました。 AIモデルのコンテキストでは、さまざまな実験シナリオが検討されており、最大90%の精度を達成して、特定のデータでAIモデルが学習されたかどうかを認識する可能性を示しました。提案されたMINTアプローチは、大規模言語モデル(LLM)の学習または微調整に敏感であるか、個人データが使用されたかどうかを明らかにするなど、複数のAIアプリケーションでプライバシーと公平性を強化するのに貢献することができます。

Takeaways、Limitations

Takeaways:
MINTは、AI / MLモデルの学習データを使用するかどうかを高精度(最大90%)で判別するための新しい方法を提示します。
個人情報の保護と公平性の強化に貢献できます。 (特にLLMの機密データを使用するかどうかを確認)
顔認識の分野を超えて、さまざまなAIアプリケーションに適用可能性を示します。
Limitations:
提示された実験は特定のデータベースとモデルに限定され、一般化の可能性に関するさらなる研究が必要です。
MINTのパフォーマンスは、使用されるデータベースとモデルの特性によって異なります。
悪意のある攻撃者によるMINT回避の可能性に関する研究が必要です。
👍