本論文は、合成積ニューラルネットワーク(CNN)の敵対的攻撃に対する脆弱性を解決するために、CNN活性化のエントロピーを監視する新しい方法を提示します。従来の敵対的攻撃の検出方法は、モデルの再訓練、ネットワーク構造の修正、または通常の入力に対するパフォーマンスの低下などの欠点を持つのとは異なり、本論文で提示する方法は、モデルを変更せずにアクティブエントロピーの変化を検出して敵対的な入力を検出します。 VGG-16を使用した実験の結果、敵対的な入力は、初期合成積層で活性化エントロピーを7%程度一貫して変化させ、これにより90%の検出精度を達成し、偽陽性および偽陰性比を20%未満に維持することを示しています。これは、CNNが活性化パターンに分布変化を暗黙的に符号化していることを示す結果であり、活性化エントロピーのみでCNNの信頼性を評価できることを示唆している。したがって、この研究は、モデルの性能を損なうことなくリアルタイムで敵対的な入力を検出する自己診断ビジョンシステムの実用的な展開を可能にします。