본 논문은 적대적 예제 정제에 기반한 확산 모델(DM)의 취약성을 해결하기 위해 새로운 적대적 안내 확산 모델(AGDM)을 제안합니다. 기존의 안내 확산 기법들은 정제된 예제와 확산된 예제 간의 거리 측정에 의존하여, 정제 과정에서 적대적 섭동이 유지될 수 있는 문제점을 가지고 있습니다. AGDM은 잠재 표현의 거리를 고려하여 적대적 훈련으로 얻은 보조 신경망을 통해 적대적 섭동을 명시적으로 포함하지 않으면서도 충분한 의미 정보를 담은 새로운 적대적 안내를 제시합니다. CIFAR-10, CIFAR-100, ImageNet 데이터셋에서의 실험 결과, AGDM은 의미 정보를 유지하면서 적대적 섭동을 제거하는 데 효과적이며, 기존 DM 기반 적대적 정제 방법보다 강건성을 크게 향상시킴을 보여줍니다. CIFAR-10에서는 평균적으로 최대 7.30%의 강건 정확도 향상을 달성했습니다.