Sign In

Assessing Robustness via Score-Based Adversarial Image Generation

Created by
  • Haebom
Category
Empty

저자

Marcel Kollovieh, Lukas Gosch, Yan Scholten, Marten Lienen, Stephan Gunnemann

개요

기존의 적대적 공격 및 방어는 작은 $\ell_p$-norm 제약 조건 내의 섭동에 초점을 맞추지만, 이는 모든 의미를 보존하는 섭동을 포착하지 못하여 강건성 평가의 범위가 제한됩니다. 본 논문에서는 점수 기반 생성 모델의 발전을 활용하여 $\ell_p$-norm 제약 조건의 한계를 극복하는 제한 없는 적대적 예시를 생성하는 새로운 프레임워크인 Score-Based Adversarial Generation (ScoreAG)를 제시합니다. ScoreAG는 기존 이미지를 변환하거나 완전히 새로운 이미지를 합성하여 이미지의 핵심 의미를 유지하면서 적대적 예시를 생성합니다. 또한 ScoreAG의 생성 능력을 활용하여 이미지를 정제하여 분류기의 강건성을 실험적으로 향상시킵니다. 광범위한 실험 평가 결과, ScoreAG는 여러 벤치마크에서 최첨단 공격 및 방어의 대부분을 개선하는 것으로 나타났습니다. 이 연구는 $\ell_p$-norm 제약 조건이 아닌 의미로 제한된 적대적 예시를 조사하는 것이 중요함을 강조합니다. ScoreAG는 보다 포괄적인 강건성 평가를 위한 중요한 발걸음입니다.

시사점, 한계점

시사점:
$\ell_p$-norm 제약의 한계를 극복하는 새로운 적대적 공격 및 방어 프레임워크 ScoreAG 제시.
이미지의 핵심 의미를 유지하면서 적대적 예시 생성 가능.
ScoreAG를 이용한 이미지 정제를 통해 분류기의 강건성 향상.
기존 최첨단 방법 대비 성능 향상.
의미 기반 적대적 예시 연구의 중요성 강조.
한계점:
ScoreAG의 계산 비용이 높을 수 있음. (명시적으로 언급되지는 않았으나, score-based generative model 사용으로 인한 계산량 증가 가능성 존재)
특정 유형의 의미 보존 섭동에 대해서는 성능이 제한될 수 있음. (구체적인 한계는 명시적으로 제시되지 않음)
👍