딥 뉴럴 네트워크는 다양한 task에서 뛰어난 성능을 보이지만, 적대적 예제에 취약하다. 적대적 훈련은 적대적 공격에 방어하는 가장 효과적인 방법으로 알려져 있다. 하지만 기존 적대적 훈련 방법은 훈련 과정에서 모델 강건성에 명확한 진동과 과적합 문제를 보여 방어 효과를 저하시킨다. 이 문제를 해결하기 위해, 본 논문에서는 매개변수 보간 적대적 훈련(PIAT)이라는 새로운 프레임워크를 제안한다. PIAT는 이전 에포크와 현재 에포크의 매개변수를 보간하여 각 에포크 사이의 모델 매개변수를 조정한다. 이는 모델의 결정 경계를 더 완만하게 변화시키고 과적합 문제를 완화하여 모델이 더 잘 수렴하고 더 높은 모델 강건성을 달성하도록 돕는다. 또한, 본 논문에서는 절대적인 크기 대신, 깨끗한 예제와 적대적 예제 사이의 로짓의 상대적 크기를 정렬하여 강건성을 더욱 향상시키기 위해 정규화된 평균 제곱 오차(NMSE)를 사용할 것을 제안한다. 여러 벤치마크 데이터셋에서 수행된 광범위한 실험 결과, 본 프레임워크가 합성곱 신경망(CNN)과 비전 변환기(ViT)의 강건성을 크게 향상시킬 수 있음을 보여준다.