본 논문은 기계 학습 모델의 적대적 훈련을 개선하기 위해 MemLoss라는 새로운 접근 방식을 제안한다. MemLoss는 'Memory Adversarial Examples'라고 불리는 이전에 생성된 적대적 예제를 활용하여 깨끗한 데이터에 대한 성능 저하 없이 모델의 견고성과 정확도를 향상시킨다. MemLoss는 이러한 예제를 훈련 에포크 전체에 사용함으로써 자연 정확도와 적대적 견고성 모두에서 균형 잡힌 향상을 제공한다. CIFAR-10을 포함한 여러 데이터 세트에 대한 실험 결과는 제안된 방법이 기존 적대적 훈련 방법보다 더 나은 정확도를 달성하면서 공격에 대한 강력한 견고성을 유지함을 보여준다.
시사점, 한계점
•
시사점:
◦
MemLoss는 기존 적대적 훈련 방법보다 더 나은 정확도를 달성한다.
◦
MemLoss는 공격에 대한 강력한 견고성을 유지한다.
◦
MemLoss는 깨끗한 데이터에 대한 성능 저하 없이 모델의 견고성과 정확도를 향상시킨다.