심층 신경망의 견고성에 대한 중요한 도전 과제인 적대적 공격은 특히 서로 다른 모델 아키텍처 간의 전이 시나리오에서 중요합니다. 본 논문에서는 공격의 효율성을 극대화하는 Exploitation과 교차 모델 일반화를 강화하는 Exploration 사이의 딜레마를 해결하기 위해 Gradient-Guided Sampling (GGS)을 제안합니다. GGS는 기울기 상승 방향을 따라 샘플링을 안내하여 샘플링 효율성과 안정성을 향상시킵니다. MI-FGSM을 기반으로 하는 GGS는 내부 반복 무작위 샘플링을 도입하고 이전 내부 반복의 기울기를 사용하여 샘플링 방향을 안내합니다. 이는 교차 모델 일반화를 위한 평탄함과 강력한 공격 잠재력을 위한 더 높은 국부 최대값을 모두 갖춘 균형 잡힌 영역에 적대적 예제가 존재하도록 장려합니다. 여러 DNN 아키텍처 및 다중 모드 대형 언어 모델 (MLLM)에 대한 광범위한 실험을 통해 GGS가 최첨단 전이 공격보다 우수함을 입증했습니다.
시사점, 한계점
•
Exploitation과 Exploration 간의 딜레마 해결: GGS는 기울기 기반 샘플링을 통해 두 목표를 조화롭게 달성하여 공격 강도와 일반화를 모두 향상시켰습니다.
•
다양한 모델 아키텍처 및 MLLM에서 우수성 입증: GGS는 여러 DNN 아키텍처와 MLLM에서 SOTA (State-of-the-Art) 전이 공격보다 뛰어난 성능을 보였습니다.
•
간단하고 효과적인 방법: GGS는 MI-FGSM을 기반으로 하여 구현이 용이하면서도 효과적인 성능을 보입니다.
•
코드 공개: 연구의 재현성을 위해 코드를 공개하여 다른 연구자들이 쉽게 활용할 수 있도록 했습니다.